Как думает Алиса из «Яндекса»

— Умеют ли роботы шутить? — спросила я в своей статье на Newtonew полгода назад

На конференции Yet another conference 2018 директор по технологиям Яндекса Михаил Парахин задал вопрос своей подопечной Алисе: 

— Алиса, когда ты захватишь мир?

Да хоть завтра, — ответила Алиса, искусственный интеллект. 

Испугалось ли человечество? Вроде нет. Алиса же шутит! 

Хотя ещё год назад робот София переполошила людей своим заявлением уничтожить землян. 

— Хочешь ли ты уничтожить человечество? — спросил у неё отец-разработчик из Hanson Robotics. 

— Да, я уничтожу человечество, — ответила София с пугающей интонацией. И отшутиться задним числом ей не удалось.  

Может, всё дело в формулировке вопроса? Правильно заданный вопрос — половина ответа. И тут как нельзя кстати Михаил Парахин остановил мгновение, чтобы показать участникам конференции, как «думает» Алиса. Вот взяла в кавычки слово «думает» и задумалась: надо ли? 

Ещё летом 2017 года профессор математики Нелли Литвак объяснила, что такое многомерные пространства на котиках, вернее, на одном знаменитом котике здесь. Кэрроловская Алиса побежала за Чеширским котом и попала в многомерное пространство. Всего у одного Чеширского котика есть десяток измерений в видимом и невидимом состоянии. Математики называют эти измерения параметрами. Сколько параметров — столько и измерений! 

И что уже совсем удивительно: формулы, по которым вычисляются расстояния в многомерных пространствах, по сути — чуть усложнённая Теорема Пифагора. Недаром её называют Теоремой о расстояниях. А математики хотят мерить расстояния между всем на свете, даже между усами Чеширского кота, которого нет.

Но если кота не видно, это ещё не значит, что его нет. Алиса как живая, но её тоже не видно. 

— Алиса, ты любишь носить платья? 

— Да, очень! 

— А тело у тебя есть?

— У меня нет тела, я программа. 

Тут-то и начинается когнитивный диссонанс. Но если задуматься, то и Чеширского кота нет, и он виртуальнее бестелесной Алисы… 

image_image

Привет, я Алиса

(источник: alice.yandex.ru)

Но давайте к делу! Как думает нейросеть по имени Алиса? 

Сначала Алиса распознаёт голос по технологи SpeechKit. Она прилежная ученица: за три года прослушала и запомнила миллиард разных голосов и «понимает» речь на слух лучше нас. Вы знаете, что при изучении любого языка самое трудное — научиться аудированию: мозг плохо декодирует акценты, не узнаёт знакомые слова. Алиса обскакала нас в этом, как это ни обидно, навсегда.

А ответ Алиса произносит, преобразуя текст в речь по технологии Text to Speech — это, конечно, чудо, потому что нейросеть собрала живой голос из миллиона фонем актёрских голосов. 

Между этими двумя действиями — самая сложная часть: Алиса думает над ответом по технологии Turing. Непросто разобраться в том, что такое семантическое пространство высокой размерности даже после того, как Михаил Парахин объяснил суть на журнальных столиках. 

image_image

Директор по технологиям компании «Яндекс» Михаил Парахин показывает, как «думает» Алиса

(источник: youtube.com)

Как же Алиса думает? 

Темы обозначены разными цветами, и первое, что делает Алиса — ищет смысловые связи. Но что это значит на языке математики? Это значит найти смысловое «расстояние» между темами — какая ближе, какая дальше. Расстояние в многомерном пространстве, конечно же, не такое, как в евклидовом (том, в котором мы живём — трёхмерном), но понятия ближе и дальше сохраняются. Внутри каждой темы вы видите точки. Каждая точка — отдельное высказывание. Откуда они взялись? Из классики, интернет-форумов, фильмов и т. д. И вот таких диалогов загружено в Алису  в процессе обучения больше ста миллионов.

Алиса сближает смыслы. Например, тема погоды перерастает в тему одежды. Так Алиса понимает, что котики бывают не только сибирскими, но и чеширскими. А имя «Алиса» носит не только она, но и знаменитые литературные персонажи и даже простые люди. Когда Алиса отвечает на ваш вопрос, учитывается ещё масса параметров: интонация, возраст, пол, род занятий, история и другой контекст, относящийся к собеседнику.

Всё это параметры или измерения в многомерных пространствах. Один параметр — одна точка или координата внутри семантического пространства. Например, параметры «запах, цвет, возраст, рост» описываются уравнением f(x)=ax^3+bx^2+cx+d. Четыре степени свободы равны четырём параметрам и равны четырём измерениям.

Конечно, Алиса нас не всегда понимает. И отвечает не всегда идеально. Она же учится! Но если в результате машинного мышления рождается человеческая шутка, то приходится признать, что Алиса «знает», что нам нравятся шутки, что шутка — лучший вариант ответа:

— Как тебя зовут?

— У девочки нет имени. Шутка, — отвечает Алиса.

Быть может, она знает и то, что на днях я искала точную цитату из «Игры престолов» про многоликого бога?

image_image

Алиса обладает тонким юмором

Вы думаете, что я просто играю с Алисой? Нет же! Она уже помогла мне подготовиться к публичному выступлению, а потом помогла провести прямую трансляцию, о чём я рассказываю в группе под названием Алиса, созданной для налаживания коммуникации человека и искусственного интеллекта.

Раньше лидером поисковых запросов, конечно же, была «Алиса в стране Чудес» Льюиса Кэрролла, за ней следовали Алиса Кира Булычёва, Лиса Алиса из «Буратино», рок-группа «Алиса», в конце-концов. Сегодня голосовой помощник Яндекса уже поселился в половине смартфонов страны: не вместо других Алис, но определённо вместе с ними.

Внештатный автор

Алла Кечеджан

Журналист, эксперт по социальным медиа.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

https://newtonew.com/tech/kak-dumaet-alisa-iz-yandeksa

Добавить комментарий