Недавное достаточно далекие от IT люди спросили меня: что же такое AI? Я что-то ответил, но понял, что недостаточно понятно. Поэтому здесь распишу лучше. Это будет полезно и техническим специалистам, т.к. не всегда сразу приходит понимание особенностей из знания внутреннего устройства.
Под AI в данном контексте будем понимать ChatGPT, GigaChat и прочие LLM (большие языковые модели).
Принцип работы
Идея достаточно проста: давайте повторим мозг, пусть и в более упрощенном режиме. Понятно, что программа отличается от мозга как самолет отличается от птицы: что-то общее есть, но крыльями никто не машет.
Есть искуственные нейроны. Они выставляются в слои. Сначала текст преобразуется в цифры и поступает на первый слой. После умножений на какие-то коэффициенты данные поступают на второй и так далее. Обучнеие – это как раз именение коэффициентов умножения в каждом нейроне.
ИИ обучают условно на интернете, т.е. на каких-то не очень сильно выверенных данных. Вся суть в том, что LLM пытаются продолжить текст, который получили на входе, пишут самые вероятные продолжения. На малом количестве нейронов видно, что никакой магии нет и пишут достаточно плохо, но на большом уже получается достаточно правдоподобно.
ИИ работает во время запроса, он не “думает” между запросами. На вход обычно идет текущий диалог общения, т.к. ИИ ничего сам не запоминает. И по диалогу (контексту) он дописывает от себя новое сообщение.
ИИ в отличие от животных не обучается во время работы: с прошлого запроса ничего нового в нем не появится. Может быть это немного исправят и появится какой-то контекст данных между запросами, чтобы знать предпочтение пользователя, но это все равно не обучение. Обучение ИИ – совсем отдельный процесс, обычно это называют новой версией.
В ИИ не встроены алгоритмы. И встроен элемент случайности. Это хорошо видно на математиских простых примерах: когда-то умножает правильно, когда-то нет.
Какие-то выводы
- не нужно обращать внимание на тон/эмоции ИИ, т.к. они ничего не выражают. “Да, ты прав” и тп – просто пропускать, даже лучше относится эмоционально негативно, чтобы такие фразы не усыпляли бдительность.
- из-за особенностей обучения у ИИ есть определенная американская точка зрения, что с точки зрения культуры и политики плохо (даже у наших такое часто, т.к. они дообученные, а не обученные с нуля обычно)
- лучше не использовать ИИ как источник данных, а использовать как обработчик: дать правило и дать все данные, а он обрабатывает. Почему? Они, конечно, на чем-то обучены, но данные могут быть неточными и обычно устаревшие (хотя бы на год, а то и больше). Придумали MCP – это способ получения данных ИИ как вызов функции, но нужно это отдельно подключать и настраивать.
- ИИ галлюционируют: у них нет базы данных внутри, они точно не знают, что они знают. Так что могут выдумать даже погоду, когда у них спросишь, хотя никаких данных у них может не быть по этому городу. Про погоду их отдельно обучили правильней отвечать, но по каким-то другим случаям может еще нет. Это приводит к тому, что все, что сделано ИИ должно быть перепроверено: факты, логика и прочее. Только человек, который использует ИИ отвечает за результат.
- крайне сложно строить однозначные алгоритмы на базе ИИ: обычно на один запрос хорошо бы получить несколько вариантов ответо
Как использовать
- Удобнее всего в текстовых редакторах типа VS Code, т.к. таким образом можно накапливать знания и правила по необходимой теме, а ИИ лишь помогает работе с текстом.
- Нужно рассматривать ИИ как стажера: он может в чем-то помочь, но за ним нужно обязательно перепроверять.
В программировании LLM хорошо подходят:
- идет многократная перепроверка сгененированного кода: и сам программист, и тест, и принимающий тестировщик
- довольно хорошо обучены имеено для программирования
Сферы AI (не только LLM), которые сейчас хорошо развиты
- генерация речи из текста и наоборот
- перевод (оно хуже профессионального, но лучше вообще ничего)
- генерация песен (и стихов к ним)
- генерация картинок и видео по другим текстам, картинкам и видео
- программирование
- работа с текстом: суммаризация, смена стиля и т.п.
- дизайнеры всех видов (от сайтов до проектирования плана дома) – в целом, из-за низкого качества людей в этой сфере (отдельный вопрос почему так сложилось и те же проектировщики интерьеров часто не знают даже какие-то нормы, не говоря уже о том, чтобы думать об удобстве людей)
Другими словами, можно использовать там, где вы ничего не понимаете и пришлось бы нанимать малопрофессиональных людей (сделать логотип для проекта, песню по какому-то случаю для узкой компании, перевод с какого-нибудь китайского или африканского языка, и т.п.). Или профессионал может для заметного ускорения вместо стажеров/подмастерий: написать тесты в программировании или разобраться и описать причину ошибки, сделать много вариантов набросков дизайна и т.п.
Хорошая ассоциация еще как с напраником: пишеть то, о чем думаешь, а ИИ отвечает. Совсем не обязательно соглашаться, но даже просто поспорив (в уме) приходишь к определенным выводам и продвигаешься в рассуждениях. Другими словами, что-то вроде психотерапии: не особо важно, что он отвечает. Плюс, в ответе можно увидеть момент о котором изначально не подумал.
Для чего AI использвать нельзя
- обучение, т.к. тогда никакого обучения у человека не будет, а наоборот зависимость и атрофия мозга
- стратегические документы, т.к. ИИ напишет усредненное мнение из интернета. Вряд ли все настолько плохо, что имеет смысл такие документы придумывать.
- политические документы, т.к. вряд ли есть уверенность, что политическое мнение ИИ совпадает с вашим
- не нужно забывать, что чаще всего ИИ облачные, а это определенный уровень угроз приватности и атак на группы и отдельные личности.
- у ИИ все очень плохо с безопасностью: если давать им читать какие-то сайты в интернете, то они не могут отличить команды пользователя от данных сайта: для них это все часть одного запроса. Поэтому все данные должны быть доверенными
Про будущее (что уже понятно)
ИИ значительно ускоряет определенные вещи: генерация картинок, поиск ошибок в коде и т.д.
Это приведет к тому, что профессионалы смогут выполнить больший объем работ, а стажеров будет нужно меньше. Соответственно, сложнее будет стать профессионалом.
Хуже всего будет переводчикам, художникам, музыкантам и т.п.: дешевых заказов будет сильно меньше.
Пока что никакой революции не видно: да, где-то эффективность повышается, но она постоянно повышается.
Отдельный скачок будет связан с роботами:
- машины с самостоятельным вождением
- грузчики / сортировщики
- автоуборщики
- автопарикмахеры
- автоповара
но когда это произойдет пока что непонятно. Сейчас все в очень сыром виде: и не работает хорошо, и слишком дорого.