ChatGPT: как втюхать лохам чат-бот как «нейронную сеть»
Важнейшим следствием и фактором доминирования в мире западных стран во главе с США является образ тотального технологического, социального, культурного, инновационного во всех сферах и смыслах их преимущества. Всё самое лучшее, самое полезное, самое прорывное происходит и изобретается на Западе, а все остальные — жалкие подражатели и вечно догоняющие неудачники. Именно такую мысль активно продвигает Америка и Европа с начала холодной войны против СССР и по сей день.
Такое самовосхваление было своеобразной реакцией американской и английской пропаганды на социальное и технологическое соперничество с «восточным блоком» и предназначалось прежде всего для внутреннего потребления. Разумеется, эта пропаганда не лишена объективных оснований. Действительно, США и страны Западной Европы были и остаются развитыми странами с впечатляющими достижениями во многих областях. Здесь вопрос в преувеличении, надутой уникальности и непоколебимой вере в то, что их причинами являются западный образ мысли и свобода политической системы.
Эта концепция оказалась настолько эффективной, что постепенно стала могучим идейным оружием своеобразного духовного закабаления зарубежных стран и незападных народов.
Можно вспомнить, как в политической линии КПСС невинный и логичный для своего времени тезис о том, что молодая советская страна должна догнать и перегнать «развитые капиталистические страны» по уровню производства превратился в нелепый хрущёвский лозунг «догнать и перегнать Америку по производству мяса, масла и молока на душу населения». Никто не задался вопросом: а зачем? Что, Америка являлась эталоном в потреблении продуктов питания?
Один из уважаемых советских инженеров авиастроения в старой лекции вспоминал, как он пришёл работать в ведущее конструкторское бюро в 1970-е гг. Начальство, с его слов, было повально заражено низкопоклонством перед американскими технологиями. Ему поручили разработку элемента авионики самолёта по аналогии с американским, хотя никто до конца и не понимал, нужен ли он, насколько он эффективен, особенно для наших условий. Раз есть у Америки, значит, нужен и нам — такая логика господствовала в бюро. Все его ссылки на методы и подходы великих — Циолковского, Жуковского, которые никогда не руководствовались догоняющими мотивами, а проповедовали опережающее развитие, — никакого отклика не находили. И это воспоминание соответствует отдельным направлениям технологического развития СССР, в котором доминировали подходы слепого копирования того, что было в распоряжении потенциального противника. Сейчас, по прошествии десятилетий, видно, что технологическое советское наследие оказалось тем устойчивее и актуальнее, чем в большей степени базировалось на собственном, независимом взгляде на решение тех или иных проблем. Там, где мы не копировали, а думали своей головой, были достигнуты самые значительные результаты, порой не превзойдённые до сих пор. Уметь взять лучшее из мирового опыта, адаптировать, усовершенствовать, при этом не впадая в догоняющее копирование, — большое искусство.
Последние десятилетия технологическая и инновационная гегемония Запада в информационном поле не выглядит столь очевидной. РФ, КНР и КНДР разработали гиперзвуковое оружие. КНР теснит Америку в космических и коммуникационных, в том числе интернет-, технологиях. РФ опережает США в ядерных технологиях. Всё громче раздаются голоса аналитиков, что через несколько лет будет ликвидировано лидерство Запада в важнейшей сфере производства компьютерных процессоров.
В ответ на это западные массмедиа интенсивно создавали культ Илона Маска и всех его проектов. Дескать, да, китайцы — молодцы, русские тоже кое-что могут, но у нас есть Илон Маск — главный «инноватор и визионер» во вселенной!
Однако, во-первых, после некоторого обострения противоречий между демократической и республиканской партиями Маск занял неправильную с точки зрения демократических медиа позицию. Во-вторых, своими действиями, высказываниями он только портит создаваемый образ, нагло пользуясь популярностью в коммерческих целях. Да и в целом, электромобилей уже больше в Китае, лучший автопилот сделал Яндекс, «гиперлуп» заглох, в лунной и марсианской программе китайцы продвинулись дальше. Теперь Маск ещё и копирует на основе купленного «Твиттера» китайскую «Вейбу»… Что остаётся такого инновационного и прорывного за ним? Только «Старлинк». Но всё это не особо технологично, просто спутниковый интернет, который существует уже много лет. Срочно нужен новый образ западного технологического превосходства в информационном поле!
На эту роль медиа был выдвинут заурядный, но яркий компьютерный продукт, основанный на так называемых нейросетях, — Chat Generative Pre-trained Transformer (GPT). Западные СМИ, блогеры и лидеры общественного мнения и внимания, паразитирующие на скандальности и напускной сенсационности, организовали мощную информационную кампанию ChatGPT. Смысл её в том, что мы вступили в период технологической революции, ChatGPT уничтожит множество профессий, чуть ли не поработит человечество и т. д. Билл Гейтс зашёл с козырей, сравнив чат с изобретением компьютера и интернета…. Пропагандисты, в свою очередь, подвизались раздувать сенсацию в политическом аспекте: мол, Запад опять победил в технологической гонке, русские и китайцы всё проморгали и т. п.
Кстати, один из основателей компании, которая разработала этот чат, — тот же Илон Маск, но теперь на Западе об этом лишний раз упоминать не принято.
Не умаляя заслуг инженеров-разработчиков ChatGPT, которые проделали великолепную работу, следует разобраться с тем, что в действительности представляет собой данный продукт, каковы его перспективы и т. д. Может ли машина обучаться и мыслить? Способна ли заменить человека в творчестве?
Первое и самое важное, что необходимо уяснить — о чём нужно говорить прямо со школы, — что никогда никакая машина не научится мыслить. Термины «искусственный интеллект» и «нейронная сеть» абсолютно некорректны и продвигаются ради дешёвого пиара. Когда читаешь статьи и слушаешь лекции специалистов и популяризаторов «искусственного интеллекта», больше всего поражает их методологическая, философская и обществоведческая безграмотность, когда они берутся рассуждать о компьютерном разуме. Впрочем, за распространённость подобных взглядов спасибо нужно сказать и нейробиологам, которые с умным видом пытаются объяснить феномен мышления биохимией и электродинамикой головного мозга.
Для того чтобы научно поставить вопрос о сущности мышления, необходимо рассматривать не процессы в головном мозге (что тоже важно, но носит подчинённый характер), а общественную и историческую практику человечества. Всякое действие человека в той или иной степени опосредовано мышлением. Если отсутствует мышление — человек без сознания, спит, в коме или вовсе умер (кстати, во сне и в коме мозг вполне себе функционирует, но мышление отсутствует). Таким образом, мышление неразрывно связано с деятельностью человека. Поскольку всё многообразие и богатство деятельности человечества можно свести к преобразованию внешних и внутренних условий жизни, постольку мышление играет ключевую роль именно в этом. Посредством мышления человек отражает в психике внешний мир, себя и способен оперировать полученными образами для управления собственной преобразовательной деятельностью.
Если на этом поставить точку, то футурологи будут счастливы. Они скажут: загрузим в комп данные (отражение внешнего мира), напишем алгоритмы, похожие на мышление (анализ, синтез, обобщение, сравнение, дедукция, индукция), — и вуаля: искусственный разум готов. Примерно так, кстати, и пытались реализовать «искусственный интеллект» до появления «нейросетей».
Первая и самая важная проблема в том, что вне общества мышление не возникает даже в самом прекрасно функционирующем головном мозге. Мышление — это свойство общества, человека общественного, а не головного мозга человека, хотя оно и осуществляется посредством оного. Ходим мы тоже с помощью ног, но никому в голову не приходит изучать перемещения человека, исследуя ноги…
Гипотетически, чтобы создать разумный компьютер, необходимо повторить на аппаратном и программном уровне возможности головного мозга, рецепторов человека и поместить его в гущу социальных связей на много лет. Причём скорость работы такого компьютера особого значения иметь не будет, так как «скорость» складывания, утверждения, развития социальных связей обусловлена «скоростью» течения жизни «кожаных мешков». Даже отбросив сомнения по поводу возможностей электроники как таковой скопировать функционал мозга (это, мягко говоря, разные «технологические уклады»), возникает вопрос в целесообразности всего этого дела. Зачем коряво повторять то, с чем прекрасно справляется процесс рождения и воспитания человека? Может, лучше совершенствовать педагогику и развивать технологии, чем играться в разумные компьютеры?
Вторая важная проблема состоит в том, что «мыслительные алгоритмы», которые берутся из положений формальной логики, мышлением, мягко говоря, не являются. Чтобы, например, разложить целое на части, недостаточно знать, что всякое целое состоит из частей и на них раскладывается, это абсолютно формальная сторона дела. В основе мышления в данном случае лежит понимание самого конкретного целого: что это, собственно, такое? Сегодня «искусственному интеллекту» это «понимание» устанавливает разработчик, например, посредством подгонки «весов» параметров данных в базе нейросети (краткое видео о том, как это работает, можно посмотреть
. И каждый объект, который мы знаем и понимаем хоть в какой-то степени, связан со всем бесконечным многообразием других объектов мироздания, часть из которых нам известна, а существование остальных мы предполагаем. Понимание чего-либо в отрыве от всего остального абсолютно бессмысленно. Мышление человека складывается от общего к частному, сначала возникает смутная картина общего мировоззрения как некоторый слепок внешнего мира в психике, а потом по мере познания она уточняется и «модифицируется».Это знают все, кто внимательно наблюдал за детьми. Мышление складывается в ходе социальной практики, социализации, общения, поступков и наступления их последствий и т. д., то есть в ходе общественной практики. Мышление тесно связано с чувственной стороной сознания, передать которую машине — это вообще отдельный, возможно, вообще нерешаемый вопрос. Если ты не организм, биологическая природа которого завязана на стремлении к жизни и страхе перед болью и смертью, вряд ли для тебя можно корректно оцифровать чувственный мир.
То, что сегодня делается в области совершенствования компьютеров, — это развитие технологии. Технология — это уровень развития способа преобразования, включающий орудие труда и навыки его применения. Технологии создаёт человек для более эффективного преобразования природы и себя самого. Компьютер, «искусственный интеллект», «нейронная сеть» принципиально, фундаментально ничем не отличаются от «палки-копалки». Отличия только в сложности и эффективности. Несмотря на громкие словечки — «искусственный интеллект», «нейронные сети», «виртуальный собеседник», «машина обучилась», — в действительности никто даже не пытается создать мыслящий компьютер, так как в инженерной IT-среде отсутствует понимание природы и сущности мышления. В этом плане программы просто подражают отдельным проявлениям человеческого мышления.
Так что тогда такое нейросети и ChatGPT?
Нейросеть, вопреки своему названию, не нейронная и не сеть. Нейросеть — это компьютерная программа, способная решать сложные задачи на основе массива данных. Обычная программа — это система запрограммированных алгоритмов, написанных человеком для решения конкретных задач средствами машины. Однако ситуации применения компьютерных программ бывают настолько сложными и многофакторными, что проще самому начать «махать лопатой», чем написать под них алгоритм. И талантливые инженеры придумали выход, который состоит в том, чтобы написать алгоритмы, которые сами напишут алгоритмы на основе загруженного массива размеченных данных. То есть нейросеть сама вырабатывает порядок действий в зависимости от того, что в неё загружено и как оно размечено. Написание алгоритмов на основе алгоритмов и данных назвали для красоты «машинным обучением». Грубо говоря, современная нейросеть из тысяч написанных человеком алгоритмов и сотен гигабайт размеченных вручную данных делает сотни миллиардов алгоритмов, которые могут сутками компилировать текст, картинки, распознавать и т. п.
Технологическая сфера «искусственного интеллекта», к которой и относятся нейросети, имеет своей задачей автоматизацию решения «интеллектуальных задач». То есть принципиально это то же самое, что калькулятор, «эксель» или «шахматный бот».
Сами идеи нейросетевых моделей и программ были придуманы ещё в 1950-е гг. и применялись с разным успехом и на Западе, и у нас. Из понимания, как устроены нейросети, следует и понимание ограниченности их применения. Они могут быть полезны там, где высокая вариативность, много информации и сносно работают «средние значения». В первую очередь, это работа с изображениями и текстом. Нейросети «выстрелили» сейчас не только потому, что вычислительные мощности стали позволять, но и в связи с тем, что человечество в современную эпоху накопило гигантский массив изображений и текстов. За последние двадцать лет люди создали текстов и изображений больше, чем за предыдущие тысячелетия. И дело не только в бесконечных терабайтах тупых фоточек, порно и бессмысленной переписки, но и, например, в картотеке снимков МРТ, изображений лиц, снимках местности, переведённых на разные языки текстов, энциклопедических статей и других весьма полезных вещей, которые нейросети могут обрабатывать куда быстрее, чем толпа кодеров будет писать программы под каждую задачу. Поэтому нейросеть — это отличное технологическое решение для некоторых областей применения, но к мышлению она никакого отношения не имеет. Это сложная, требующая больших вычислительных мощностей и большого размеченного массива данных компьютерная программа. И поскольку все результаты работы нейросети основаны на «средних значениях», которые, в свою очередь, берутся из разметки человеком «скормленных» ей данных, то они всегда требуют перепроверки человеком на выходе. По крайней мере там, где результаты могут привести к нежелательным последствиям.
Наиболее впечатляющие результаты нейросети демонстрируют в работе с текстом, потому что, во-первых, им можно относительно просто «скормить» огромный массив размеченных текстов, во-вторых, законы языка не так сложно перевести в алгоритмы. Вы могли заметить, что в последние годы «технический перевод» «Яндекса» значительно похорошел. Если раньше читать переведённые статьи было сложно, и передавался только общий смысл, то теперь перевод достиг таких высот, что «Яндекс» позволил себе даже прикрутить его к «Ютубу» вместе с распознаванием речи. И получилось в целом нормально. Всё это стало возможно из-за программ, построенных по принципу нейросети. Однако это не значит, что профессия переводчика канула в лету, никакая нейросеть никогда не сможет понять смысл текста или сказанного, поэтому при встречах Путина и Си Цзиньпина по-прежнему будут присутствовать переводчики, а русские поэты будут переводить Байрона.
ChatGPT, как это и видно из названия, — это чат-бот, то есть компьютерный собеседник, машинный попугайчик, созданный для развлечения. Сенсация ChatGPT состоит в том, что разработчики, увеличив массив данных до гигантских размеров, создали нейросеть, способную заменить миллионы простеньких компьютерных программ под самые разные задачи. И всё это стало возможно посредством простого предугадывания слов так, как это делает в поисковой строке «Яндекс» или телефон при наборе сообщения. Просто если «Яндекс» угадывает слово на основе самых частых запросов, а телефон на основе прописанных алгоритмов, тоже наиболее вероятных вариантов продолжения текста, то ChatGPT базирует выдачу на огромном массиве размеченных и категоризированных данных. В ChatGPT загружены тексты в миллиарды слов, им выработаны миллионы «весов» и алгоритмов связей слов, понятий, что позволяет составлять последовательности слов, которые складываются в удобоваримые ответы. Причём ответы не одинаковые, ChatGPT задействует генератор «псевдослучайных чисел», чтобы на выходе казалось, что он вариативен. Вы сами можете это перепроверить, задавая ему вопросы об источниках той или иной информации и о том, как конкретно он обрабатывает запрос. При генерации слов ChatGPT использует тематически отобранный комплекс текстов. Вы отправляете запрос, который нейросеть разбивает на слова и, в зависимости от их набора и, возможно, порядка, определяет наиболее вероятную тему запроса. Далее, используя свою базу данных, выбирает по теме источники и генерирует на их основе складный текст.
Нужно понимать, что нейросеть не имеет задачи давать правильные ответы, какие-то адекватные знания и т. д. Она лишь генерирует слова, предложения и абзацы текста в соответствии с запросами. Сопутствующие и единственно полезные её функции — это решение каких-то прикладных задач. Например, ChatGPT легко может переформулировать текст, придав ему уникальности, составить вымышленный рассказ, компилируя то, что у него есть в базе данных, решить математическую задачу или написать программный код. Или генерировать идиотские анекдоты...
Ответы на конкретные вопросы и оперирование фактами — одна из слабых сторон машины по понятным причинам: так как данные размечены не по принципу адекватности и полезности содержания, а тематически. Скажем, если вы попросите расписать политическую систему РФ, то ChatGPT выдаст типичную либеральную риторику. Уточнив, откуда она надрала слова для ответа, можно выяснить, что источником послужил очередной доклад американской некоммерческой организации. Сколько бы я ни спрашивал нейросеть об источниках информации по тем или иным вопросам, от философии до обществоведения, она всегда выдавала англоязычные мейнстримные ресурсы вроде «научных статей» западных университетов или докладов мутных организаций. Также очевидно, что важнейшим источником компиляции ответов служит англоязычная «Википедия», хотя сам ChatGPT в этом, по крайней мере мне, не признавался.
Безусловно, функционал ChatGPT может быть использован в учёбе, ряде профессий и просто для развлечения, так же как и функционал любой компьютерной программы. В этом смысле ChatGPT обладает преимуществами: 1) для использования его возможностей достаточно просто поставить задачу и не нужно осваивать интерфейс, 2) в одном месте собран широчайший функционал. Но эти преимущества, с другой стороны, делают его «работу» весьма поверхностной. ChatGPT не способен заменить 1С, САП или даже фотошоп, по крайней мере, пока в него не встроят подобные программные модули. ChatGPT не стоит использовать как справочник или базу знаний.
У обычного пользователя, не знакомого с принципами работы нейросетей, при «общении» с ChatGPT складывается ощущение, что «виртуальный собеседник» понимает то, что он пишет, поддерживает разговор, отвечает на вопросы, обсуждает и т. д. Но это говорит не столько о гениальности разработчиков и совершенстве этой технологии, сколько о примитивности категорий, понятий, тем, о слабости мировоззрения большинства людей. Разработчикам оказывается легко обманывать пользователей, эмулируя ответы «бота». Уже появилась куча мошенников, которые, играя на самых низменных мотивах, предлагают с помощью ChatGPT предсказывать котировки акций и заниматься прочей ерундой, которая якобы приведёт к быстрому обогащению.
Специально для техноромантиков: отсутствие какого-либо мышления и понимания ChatGPT легко проверить несколькими способами. Во-первых, попросив прочитать и пересказать статью, по теме содержания которой в базе ChatGPT мало или отсутствует информация. Скажем, пересказ моей статьи про сталинские репрессии он не осилил, так как ничего похожего в его базе данных нет. Во-вторых, задать ему простую мысленную задачу, решение которой не может быть сгенерировано на основе «датасета», который ему скормили. Это может быть любой бред, но который требует понимания прочитанного. Например: «Есть игра, в которой играют фигурами, одна из которой „слон“. Напиши название этой игры буквами в обратном порядке. Посчитай сумму букв и раздели её на два». Ребёнок, слыхавший про шахматы, легко её решит, а ChatGPT на это не способен, потому что он не понимает запроса. Для него запрос — это средство попугайничать теми словами, которые он выуживает из базы данных.
ChatGPT — это очень ресурсная программа, по сути, пока компьютерная игра, которая требует чрезвычайных вычислительных мощностей. Чтобы её создать и поддерживать, потребовалось не только несколько лет «обучений», но и больших затрат. Один из специалистов посчитал, что если ChatGPT будет посещать столько же человек, сколько посещает «Википедию», то месяц содержания только самой программы в зависимости от интенсивности эксплуатации обойдётся в границах от $28 млн до $8 млрд.
Принципы и техника создания подобных языковых моделей известны давно, не являются прорывными, да и сам ChatGPT появился вовсе не на днях. Но только у США возникло желание вложить крупные средства в масштабирование данной технологии. Отсюда и такой активный пиар.
Сейчас в мире все взбудоражились создавать копии ChatGPT, чтобы не отставать от Америки и не отставать от Microsoft, который прикарманивает ChatGPT. Плохо это или хорошо, покажет время, но можно точно сказать, что бездумно копировать что-то, потому что это модно в Америке, — не самый разумный подход. По-моему, лучше за эти ресурсы сделать несколько более заточенных под конкретные задачи нейросетей, чем гнаться за «универсальной болталкой», которая якобы когда-то начнёт мыслить.
Что касается технологической революции и победы Запада в «гонке ИИ», то это, конечно, не более чем бравада. ChatGPT — интересный, но сырой продукт с сомнительными перспективами его реального применения. И главное, он не представляет собой какой-то оригинальной разработки, это обычная «языковая модель», которую просто «накачали» огромным массивом данных, используя большие вычислительные мощности. Поисковик, голосовой помощник, переводчик, бот-кодер, копирайтер — наиболее вероятное будущее подобных программ. Но всё это, по сути, уже существует, просто ChatGPT дал новую красивую обёртку и новый уровень удобства пользователю.
Анатолий Широкобородов,