Бороться с котами и понимать людей

Бороться с котами и понимать людей

// Чему научилась нейросеть в 2016 году
Авторы: Светлана Соколова

Искусственная нейронная сеть — это математическая модель, построенная по принципу работы сетей нервных клеток живого организма. Алгоритм, который можно использовать на самых разных компьютерах. Он моделирует связи нейронов и способность мозга обучаться: запоминать, сравнивать, делать выводы. Интерес к нейронным сетям вспыхнул в середине нулевых, когда информатики Джеффри Хинтон и Руслан Салахутдинов создали эффективные алгоритмы. С тех пор, на радость ленивому человечеству, нейросети становятся всё умнее и умнее. Мы не смогли перечислить все их достижения за прошедший год и выбрали самые выдающиеся. 

Понимать смысл

// Длинный хвост

Новый поисковый алгоритм Яндек­са — на основе обучения искусственных нейронных сетей — способен находить страницы не только по ключевым словам, но и по ­смыслу. Так проще получать адекватные ответы на запросы вроде «фильм про человека, который выращивал картошку на другой планете» («Марсианин») или «фильм, где ­физики рассказывали даме про ­дейтерий» («Девять дней одного года»). «График частотного распределения запросов в Яндексе часто представля­ют в виде птицы, у которой есть клюв, туловище и длинный хвост. Список самых ­распространённых запросов не особо велик, но их задают очень-очень часто — это “клюв” птички. Запросы средней частотности образуют “туловище”. Низкочастотные запросы по отдельности встречаются чрезвычайно редко, но вместе составляют существенную часть поискового потока и поэтому складываются в “длинный хвост”», — говорится в официальном пресс-релизе компании.

Когда одинаковых запросов ­много, поисковик часто тренируется и хорошо — быстро и точно — ­находит правильные страницы. А когда спрашивают что-то оригинальное, он плохо понимает, какие сайты искать. Яндекс начал использовать нейронные сети, чтобы в будущем научить браузер понимать семантику слов на уровне человека.

Вести твиттер

// Дипдрампф и Нейромзан

Стенограммы выступлений кандидата в президенты США Дональда Трампа отличались не только объ­ёмом, но и некоторой несвязностью, что сделало их идеальным материалом для обучения сети. Всё-таки выдавать совсем уж осмысленные словосочетания искусственному интеллекту пока сложно. Сейчас от лица «нейроТрампа» ведётся микроблог @DeepDrumpf, и его читают около 30 тысяч человек.

Обучалась на речах так называемая многослойная рекуррентная нейросеть. Она способна запоминать и предсказывать последовательности символов: каждый следующий создаётся с учётом предыдущего. А это позволяет генерировать содержательные фразы. Конечно, для этого сеть должна пропустить через себя не менее 700–800 тысяч слов текста.

В России «примером для подражания» стал другой одиозный политик, чьи высказывания имеют те же особенности, что и у 45-го президента Америки, — Рамзан Кады­ров. Сеть натренировали на Insta­gram-постах главы Чеченской Республи­ки, и теперь микроблог @neuro­m­zan регулярно пишет твиты, пес­трящие словами «Чечня», «мечеть», «Аллах», «брат». Цитата от 25 августа: «Сегодня в Чечне не было никаких проблем».

Делать трейлеры для ужастиков

// Здравствуй, Морган

Суперкомпьютер IBM Watson способен делать выводы на основе полученной информации и запоминать их. Благодаря этому киностудия «XX век Фокс» и научно-исследовательское подразделение IBM Research научили Watson «­понимать» человеческие страхи. Мозг суперкомпьютера натренировали на трейлерах ста фильмов ужасов. Каждый ролик был разбит на фрагменты, которые нейросеть анализировала по нескольким пунктам: ­люди, декорации, звук, ­композиция кадра. Объектам присваивались определения: «тёмный», «красивый», «пустой», «громкий» и т. д. Экзаменационной работой стала лента «Морган». Нейросеть выбрала из видеоряда самые эмоциональные кадры и расположила их в том порядке, который показался ей наиболее правильным. Получился полутораминутный трейлер. И он реально жуткий. Правда, монтировали и озвучивали ролик люди.

Узнавать лица

// Не спрячешься

Ещё одна разновидность нейросетей, сиамская, обычно используется в задачах на поиск общих признаков или связей между двумя объектами. Например, для сличения одной и той же подписи, оставленной разными людьми. Именно такую нейросеть специалисты из Института Макса Планка научили распознавать размытые и закрашенные лица.

В порядке тренировки сеть проана­лизировала 13 тысяч фотографий 600 людей: на одного человека приходилось до десяти снимков. Потом сети показали изображения размытые и закрытые чёрными и белыми квадратами. Если освещение, одежда или обстановка были разными и на учебном фото, и на контрольном, точность распознавания составляла от 14 до 29 %. Если одинаковыми, эффективность возрастала до 81 %.

Отпугивать котов

// Мокрый нейробрысь

Инженер Роберт Бонд создал нейросеть, которая умеет прогонять с участка перед домом котов, желающих пометить территорию. Система распознаёт животное, подаёт сигнал устройству для орошения газона, и струя воды окатывает непрошеного гостя. В основе технологии — алгоритм, нацеленный на распознавание изображений, и платформа Jetson TX1 для обучения роботов и дронов — размером с кредитную карту и производительностью до терафлопса.

Система следит за событиями во дворе с помощью камеры. Все движения фотографируются, отправляются на платформу и пропускаются через нейросеть. Искусственный интеллект определяет, кто изображён на снимках.

Распознавать речь

// Робот-переводчик

Компания Microsoft научила нейросеть рекордно точно понимать, что говорят люди. В программе используются сверхточные и LSTM-нейросети. Первые интересны тем, что их архитектура позволяет наращивать много-много слоёв нейронов без больших вычислительных затрат. Это важно для решения таких задач, как распознавание речи. Вторые способны долго хранить информацию и работать с длинными предложениями. Лингвистическая модель была обучена с помощью расшифрованных разговоров общим объёмом примерно 350 миллионов слов. Обучение заняло две тысячи часов. Наибольшую трудность у программы вызвали междометия типа «хм», «ага», «ох».

Превращать каракули в шедевры

// Инцепционизм

Программа Neural Doodle на основе свёрточной нейронной сети превращает каляки-маляки в приличные картины. На вход подаётся образец стиля, которому вы хотите подражать, а также его семантическая карта — схематический набросок, который можно сделать в простейшем графическом редакторе. Программа считывает характеристики вводной картинки и применяет их к вашему рисунку.

В 2015 году популярность приобрела технология Deep Dream, позволяющая имитировать полотна известных художников. Гики объявили новое направление в искусстве — инцепционизм.

Разбирать марки автомобилей

// Компьютерное зрение

Приложение Авто.ру для iOS и Android может по фото определить марку, модель, поколение и среднюю стоимость автомобиля. Распознавать машины помогает технология компьютерного зрения, разработанная в Яндексе. Чтобы научиться «видеть», она должна проанализировать достаточно большую выборку картинок, определяя, какие из них содержат искомые изображения. Специалисты Авто.ру тренировали нейросеть на шести миллионах фотографий, взятых из базы данных сайта.

Надо понимать, что подобные эксперименты — лишь маленькие ступеньки, ведущие к достижению таких глобальных целей, как, например, разработка системы компьютерного зрения для беспилотных автомобилей.

Играть в го

// Просчитать ходы

Нейронная сеть AlphaGo от Google одержала три победы подряд над одним из сильнейших игроков мира в го Ли Седолем. Для обучения в AlphaGo был загружен массив сыгранных матчей между профессионалами. Сеть впитала накопленный опыт и начала играть сама с собой. Её интересовало, какой ход из какой точки будет наиболее эффективным. В отличие от шахмат или шашек, в го нужно не выстраивать долгосрочную стратегию, а решать конкретные задачи. Этим и занималась AlphaGo, перебирая близкие возможные ходы, используя метод Монте-Карло, оценочные и предсказательные возможности. Первое поражение, нанесённое сетью, оказалось полной неожиданностью для Седоля, да и для всего мира. Но позднее в двух играх из пяти он взял реванш.

Отличать достаток от бедности

// Из космоса видно всё

Учёные из Стэнфорда опубликова­ли статью в Science, где описали новый способ определять уровень жизни и дохода населения по спутниковым снимкам. Эта технология является ещё одной попыткой полу­чать данные об экономическом развитии стран третьего мира.

Система проанализировала огромное количество фото, сравнивая изображения со статистикой Всемирного банка и проекта демографических исследований Demogra­phic and Health Surveys. В результате нейросеть вывела закономерности и научилась распознавать приметы бедности: дороги без покрытия, низкоэтажную застройку, расстояние до ближайшего источника воды и торговой точки, уровень освещённости в ночное время. Ожидается, что новая технология поможет эффективнее распределять помощь жителям беднейших стран планеты: Малави, Нигерии, Руанды, Танзании, Уганды.

Шифроваться

// Алиса, Боб и Ева

Учёные из Google Brain создали три нейросети, две из которых, ­Алиса и Боб, обменивались зашифрованными сообщениями, а третья, Ева, пыталась их «подслушать» и понять, о чём они говорят. Алиса и Боб сами выбирали способ шифрования. В большинстве случаев им удалось скрыть переписку от Евы — она не смогла её взломать. ­Алиса получала входное сообщение и ключ, а на выходе генерировала сообщение, которое передавала Бобу вместе с ключом. Боб должен был воспроизвести исходное сообщение. Ева ­получала сообщение без ключа и, как и Боб, должна была его прочесть.

Улучшать изображения

// Добавить недостающие детали

Стартап Magic Pony Technology разработал технологию, для улучше­ния качества фото- и видеоизобра­жений в реальном времени. Исследователи генерировали картинки низкого качества из картинок высокого разрешения и подавали эти пары изображений на вход нейросети. В итоге она научилась выявлять закономерности и проделывать обратную операцию, то есть добавлять в изображение недостающие детали. В будущем технология позволит повышать качество фотографий.

Переводить тексты

// Нейротранслейт

Человечество давно ломает голову: как научить компьютеры переводить столь же качественно, как это делают люди? Google представил рекордно точную систему перевода, основанную на обучении нейросетей, способных ­запоминать свои состояния и пользоваться этим опытом при выборе варианта. Это позволяет при переводе словосочетания «тугой лук» (из которого стреляют) не трактовать последнее слово как onion (овощ). Учитывается не только типичное ­значение лексической единицы, но и её контекст. Правилам сочетаемости слов нейросеть училась на готовых текстах нескольких языковых пар: англо-китайской, англо-французской, англо-испанской. Разрыв между качеством машинного перевода и «настоящего» исстари был огромный, но, кажется, его удаётся сократить.

Писать стихи

// Нейронная оборона

Сотрудники Яндекса на досуге записали альбом «404. Нейронная оборона», стилизованный под творчество культовой панк-группы «Гражданская оборона». Сборник состоит из 13 композиций на стихи, созданные нейросетью. Имитировать поэзию покойного лидера «ГО» Егора Летова оказалось проще, чем классические стихи, — по той же причине, по которой эксперименты с нейротвиттером начались с подражания Трампу и Кадырову: большинство текстов написано в абсурдистской манере. Авторы эксперимента признаются, искусственному интеллекту пока легче косить под Хармса, чем под Пушкина. Технология создания автостихов на основе поисковых запросов была разработана в Яндексе несколько лет назад. Но эксперимент с публичной мистификацией проведён впервые.

Цитата из нейроЛетова: «В ожидании чудес, / Невозможных чудес, / Я смотрю в темноту, / Но я не верю в прогресс».

Опубликовано в журнале «Кот Шрёдингера» №12 (26) за декабрь 2016 г.