О проблеме головастика и сумчатой кунице в искусственном интеллекте.
Я дослушал очередную аудиокнигу про когнитивное религиоведение и решил следующую послушать о чем-то близком и родном (и более приземленном). Выбрал эту.
Книжка короткая, за день на 2x можно успеть послушать, и вполне соответствует ожиданиям. В начале (60% книги) психолог и математик пересказывают занятные примеры ошибок систем с машинным обучением.
- Вы обещали нам ИИ, а по-факту оно путает игрушечных черепашек с винтовками, а негров с гориллами!
- Почему, спрашиваем мы, приличный чат-бот, общаясь со стадом расистов, мало того, что не привил им высоких моральных идеалов, так еще и сам стал расистом?
- И да, кстати, почему робо-рабов все еще нет в каждом домашнем хозяйстве?
Оставшихся 40% времени авторы дают советы как исправить ситуацию.
1. Принять нейросети и big data такими какие они есть и перестать проецировать на них свои завышенные ожидания.
2. Постичь модульные системы, символьные вычисления, иерархические репрезентации, каузальное моделирование, семантические сети, формальную логику.
3. Черпать вдохновение из мудрости предков: биологии развития, психологии, лингвистики и нейробиологии.
4. Медитировать над «Критикой чистого разума» и Екклесиастом.
5. Если вы все сделали правильно, то в заключительной главе в мозгу заиграет песенка: “Позабыты хлопоты, остановлен бег, вкалывают роботы - счастлив человек!”
И ничто бы не нарушало эту гармонию. Если бы не русский перевод.
На сайте издательства гиперссылка с имени переводчика ведет к злобной красной табличке “Элемент не найден!” И это явно неспроста (как будет убедительно показано ниже).
Переводчик на каждом шагу изобретает собственные термины вместо существующих. Казалось бы, неужели сложно открыть нужный термин в английской Википедии, а потом переключиться на русскую версию, чтобы увидеть, как это звучит на родном языке? Пришел-увидел-победил. Но нiт!
Вот вам список терминов из перевода, а вы попробуйте угадать, что было в оригинале.
Свёртывание, контролируемое и неконтролируемое обучение, переоснащение, стирание, разработка функций, проблема головастика, супер-разведка, сумчатая куница, весло, дурацкий волшебник.
Ну ладно, если вы в ML, то первые три угадать просто:
• “свёртывание” — convolution, свёртка.
• “контролируемое и неконтролируемое обучение” — supervised/unsupervised learning, обучение с учителем/без учителя.
• “переоснащение” — overfitting, переобучение, оверфиттинг.
Дальше веселее. Богатство образности постепенно превышает болевой порог:
• “стирание” — dropout, дропаут. Да, заимствования это естественно и удобно.
• “разработка функций”, “проектирование функций” — feature engineering, конструирование признаков.
• “проблема головастика” — “long tail” problem (про форму распределения).
• “супер-разведка” — Superintelligence, “Сверхинтеллект“ — книжка одного философа, которому нужно было стать фантастом.
• “сумчатая куница” — "tiger cat”, полосатый кот, один из классов в ImageNet.
• “весло” — paddle, теннисная ракетка в игре Breakout. И дальше по тексту переводчик уверен, что игрок гребёт.
На фоне проблем головастика, мои личные проблемы, конеч��о, меркнут. Но дальше — лучше. Иногда переводчик вставляет “пояснения”, которые полностью меняют смысл.
• “дурацкий волшебник (вспомните джиннов из сказок Шахерезады)” — idiot savant. Ну да, мы же все помним, что ИИ это про магию, а не про аутистов.
• “лингвистическая база Word2Vec” — representations like Word2Vec. Это не база.
• “преобразование голоса в текст и компьютерные команды” — voice recognition. Вообще-то, идентификация по голосу.
• “вы создаете у системы все расширяющееся чувство вины” — to do “blame assignment” in complex networks, то есть “искать виноватых” внутри сложных сетей. Речь про алгоритм обновления весов в нейронной сети.
“How did we get into this mess?” — спрашивают авторы.
“Откуда берется вся эта абракадабра?” — удивляются переводчики.
А большинство фейлов объясняется просто: засуньте текст в Google Translate и вы получите именно такой перевод. Иронично выходит — авторы всю дорогу унижают гугловый сервис, а вот переводчики, наоборот, почитают его за образец для подражания. Но это объяснение слишком скучное, чтобы быть истинным.
Поэтому, вот вам более рациональное в стиле Юдковски:
Недружественный ИИ из будущего нарочно испортил книгу, которая помешает его появлению, если вы ее прочтёте, а потом оставил сообщение на сайте издательства, чтобы похищенных им переводчиков никто даже не пытался разыскать.
Ну вот, восторгом я с вами поделился, так что теперь можно идти дальше создавать все расширяющееся чувство вины у нейронных сетей.