Дмитрий Масюк: нейросети уже сейчас непросто отличить от человека

shishkin 09.09.2023 Комментариев нет

– Всего по России мы уже накатали, сложно себе представить, в общей сложности 26 миллионов километров. Пилотом в Ясенево мы довольны, мы впервые посадили водителя-испытателя не за руль, а на соседнее сиденье, и он контролирует вождение, может экстренно притормозить с помощью специальной кнопки. Пользоваться роботакси в Ясенево сейчас могут около 10 тысяч человек, нам нравится, что получается по результатам тестирования. Мы постепенно расширяем доступность услуги для новых пользователей, и все, что касается автономного вождения и перевозок.

У нас еще есть роботы-доставщики, роверы, и с ними есть планы по расширению локаций. Мы уже начинаем сдавать роботов в аренду магазинам и ресторанам, обсуждаем и более масштабные проекты, например, полностью роботизированный кампус университета, в котором доставку осуществлять будут только роботы.

Дмитрий Масюк: нейросети уже сейчас непросто отличить от человека

– Летающих – нет. Нам не кажется, что в этом есть такая уж сейчас большая востребованность, не видим в них практической пользы. На обычных роверах мы уже отвезли 250 тысяч заказов. Они работают во многих районах Москвы, под Санкт-Петербургом в Мурино, в Иннополисе вся доставка только на роверах. То есть технология уже хорошо работает, сейчас важно сделать ее недорогой, и чтобы люди к этому привыкли. Совсем массовой она станет через какое-то количество кварталов и лет.

– Я понимаю, что всех волнует, когда уже у меня появится возможность поехать на беспилотном такси. Но для тестирования технологии это не обязательно, центр города мало отличается от Ясенево, может, просто он чуть более оживленный. Я не стал бы сейчас давать какие-то точные прогнозы, когда мы появимся в соседнем районе. Технология развивается, пока нигде в мире еще не удалось сделать эту технологию массовой, но я думаю, на каком-то горизонте это станет возможным, станет частью повседневности.

– В этом и цель.

Дмитрий Масюк: нейросети уже сейчас непросто отличить от человека

– В России один из самых прогрессивных в мире законов в сфере развития беспилотных автомобилей. Он позволяет тестировать эти технологии в небольших городах с современной инфраструктурой, таких как Иннополис, в мегаполисах, на федеральных трассах. Поэтому перспективы хорошие, но здесь не нужно никуда торопиться, главное – это безопасность пассажиров.

Ключевой показатель, за которым мы наблюдаем, – это с какой частотой водителю приходится как-то вмешиваться. Частотность таких случаев снижается, мы буквально в километрах это измеряем. Точные сроки я бы не стал прогнозировать, потому что все, кто пытается их обозначить, часто оказываются более оптимистичными, чем реальность.

– Это какое-то небольшое количество лет, не 10, абсолютно точно.

– Смотря что считать аварийностью. Если, например, говорить о столкновениях с другими машинами, это единичные случаи – все же испытатель рядом очень помогает. Происшествий, в которых пострадал бы человек, у нас не было ни одного.

Дмитрий Масюк: нейросети уже сейчас непросто отличить от человека

– Это очень хороший вопрос. Я думаю, здесь ситуация как с самолетами. Большинство людей хотя бы раз испытывали страх во время перелета, потому что ты не можешь сам контролировать самолет. При этом всем известно, что самолеты безопаснее, чем автомобили. А автономные автомобили будут на порядок безопаснее, чем обычные, потому что 90% аварий – это человеческий фактор, который в автономном автомобиле просто исключен. Он никогда не устает, он все делает с идеальным вниманием в каждый момент времени, видит на 300 метров вперед и назад, на 360 градусов, в отличие от человека. И каждый наш автономный автомобиль сейчас использует опыт этих самых 26 миллионов километров, которые ни один человек за всю жизнь не накатал.

Поэтому какой-то дискомфорт у всех, у меня, в частности, может быть и будет. Но надо понимать, что технология станет массовой, только когда она будет на порядок более безопасной, чем самый идеальный водитель.

– Что касается «Алисы», мы очень удивлены результатами в этом направлении: мы, по сути, и есть рынок умных устройств в России, наша доля – примерно 90%. И на данный момент мы уже продали порядка семи миллионов умных колонок, и интерес к ним не снижается, выручка умных устройств в этом году растет на 70% по сравнению с прошлым годом. Казалось бы, у нас и так 90%, чего тут еще делать? Но если просто представить, что в России около 50 миллионов семей, только у 15% из них есть наши колонки. Наша задача, конечно, чтобы «Алиса» была в каждом доме.

Дмитрий Масюк: нейросети уже сейчас непросто отличить от человека

Кроме того, мы выпустили на рынок умные телевизоры и хотим с ними повторить успех колонок, потому что мы все всегда сидим с телефонами, и нет никаких причин, чтобы дома телефоном не стал телевизор. С ним можно делать буквально все то же самое, только на большом экране, и управлять голосом.

– С нейросетями все то же самое – мы хотим, чтобы ими пользовался каждый, и здесь мы тоже в самом начале пути – текстовыми нейросетями в России активно пользуются, согласно нашим опросам, около 5% людей, хотя бы раз ими пользовались еще 19%. То есть три четверти людей в России ни разу не общались с нейросетями. Поэтому фронт работ большой, мы активно развиваем базовую технологию, но еще больше усилий прикладываем, чтобы встроить нейросети в наши основные продукты, в том числе в «Поиск», которым ежедневно пользуются десятки миллионов людей. Наша цель в следующем году, чтобы как минимум половина пользователей наших продуктов начала явно или неявно пользоваться нейросетями через них.

– С точки зрения процесса есть три этапа. Первый – развитие базовой модели, которая обучается на очень сконденсированной копии интернета, грубо говоря, в нее загружают вообще все качественные тексты, которые когда-либо кто-либо видел. Второй – увеличение самой модели и третий – процесс fine tune. Мы постоянно работаем над тем, чтобы в начале обучения, на так называемом этапе pretrain, отбирать наиболее качественные данные. У нас сидит команда людей и разработаны специальные механики, которые определяют, какие тексты включать в обучение нейросети, потому что очевидно, что влезет не все – в интернете больше пяти петабайт информации, мы должны отобрать из них 20 терабайт, то есть в тысячи раз меньше. Выросло число параметров, которые обрабатывает нейросеть, сейчас мы увеличили их число в несколько раз.

Дмитрий Масюк: нейросети уже сейчас непросто отличить от человека

Третий этап – это фидбэк от человека. Это AI-тренеры, мы уже наняли их сотни и еще продолжаем нанимать, которые профессионально пишут примеры качественных текстов на самые разные темы – от науки до стихов, потому что модель должна все уметь. Они обучают нейросеть на примерах и вслепую сравнивают ее ответы, чтобы нейросеть понимала, какие из них хорошие.

– Сто процентов – мы собираем отзывы пользователей, просим оценить ответы нейросети. Но я думаю, что промпт-инжиниринг (умение правильно задавать вопросы нейросети – ред.), который все сейчас обсуждают, в ближайшее время будет сдуваться, потому что фундаментальная задача всех языковых нейросетей – сделать так, чтобы модель на человеческом языке поддерживала разговор и понимала контекст.

– У меня абсолютно точно нет страха, у меня есть какое-то благоговение перед тем, что происходит, потому что это происходит под моим руководством и моими командами. Рост качества ответов моделей действительно взрывной, и сейчас на какую-то среднюю тему нейросеть поддержит разговор едва ли не лучше, чем человек. И это естественный процесс, я вижу в этом прежде всего очень много пользы. Конечно, здесь есть и риски, но посмотрим, что будет. Так что нет, я не боюсь, я жду.

– Я думаю, что во многих аспектах это уже сейчас так, и через небольшое количество лет по большинству мыслимых тем «Алису» сложно будет отличить от человека, и тест Тьюринга она пройдет. Я думаю, что даже сейчас уже топовые модели нейросетей, нашу в частности, в чате непросто было бы отличить от человека.

Дмитрий Масюк: нейросети уже сейчас непросто отличить от человека

– Конечно, мы постоянно сравниваем наши модели, но это довольно непросто, так как если нейросеть, которая решает задачки по физике, сочиняет сказку и может написать письмо руководителю, лучше делает одно и чуть хуже – другое, то мы какой вывод делаем? Она лучше или хуже? Наша базовая модель уверенно обгоняет в ответах на русском языке ChatGPT 3,5 и в десятках процентов случаев дает более качественный ответ, чем ChatGPT 4. Пока мы ее не догнали, но это вопрос времени. А модель LLama 2 7b по результатам тестов мы обходим уже и на английском, родном для нее языке.

– Мне кажется, что идея и образ универсального искусственного интеллекта, который не просто с тобой через чат общается, а еще и может что-то делать, он совсем не нов. «Алиса», я думаю, уже стала частью культуры крупных городов, как те же курьеры, например. Напрямую ребята из «Двух холмов» с нами не консультировались, но нам радостно видеть, что нами, очевидно, вдохновились.

И я думаю, что если не говорить о приготовлении еды, а просто поговорить, дать какие-то задания, то в своих телевизорах и колонках мы уже тестируем такие возможности, когда «Алису» можно попросить сделать что-то внутри экосистемы, например, заказать такси, включить умный чайник или лампочку.

Что касается приготовления физической еды, то через какое-то количество лет мы придем и к этому, я убежден. Не так быстро, поскольку здесь речь скорее о робототехнике, где все развивается медленнее. В цифровой среде уже на следующий год все это будет возможно, в реальной среде – на горизонте 5-10 лет уже можно будет «Алисе» что-то поручать.

Добавить комментарий Отменить ответ