Андрей Белевцев в интервью Business FM рассказал о том, на что способен искусственный интеллект, почему компаниям стоит использовать облачные решения и как «Сбер» создал первый банкомат на Linux
«Сбер» давно занимается развитием искусственного интеллекта. В 2022 году он представил нейросеть Kandinsky, которая умеет генерировать изображения по запросу, а в апреле этого года анонсировал мультимодальную модель GigaChat. О разработках в области искусственного интеллекта и об отечественном программном обеспечении главный редактор Business FM Илья Копелевич поговорил с руководителем технологического блока «Сбера» Андреем Белевцевым.
У нас в студии Андрей Белевцев, руководитель технологического блока «Сбера», всех 40 тысяч IT-специалистов, которые находятся на самых передних краях развития искусственного интеллекта. Один из последних продуктов, представленных вашей командой, GigaChat, — это реплика, ответ OpenAI. Пока он еще в бета-версии, но нам тоже есть, чем ответить. Умные чат-боты пишут за нас рефераты, музыку, говорят и думают за Жириновского или за нас самих, пишут пресс-релизы. Это главное, на что способен ИИ, или это хайп, когда люди знакомятся с ним и играют в понятные простые вещи, но, может быть, вовсе ненужные?Андрей Белевцев: Самое неправильное, что сейчас можно делать, — считать происходящее с большими языковыми моделями, такими как OpenAI, модой, хайпом и так далее. Мы становимся свидетелями следующей волны продуктов на основе искусственного интеллекта. Это новый технологический рывок. Когда мы говорим, что ИИ — это технологии будущего, мы недооцениваем, что это технологии уже настоящего, и тем более будущего, просто нарастает скорость изменений. То, что происходит сейчас с большими моделями, фундаментально изменит каждую область нашей жизни. То, как мы ими пользуемся сейчас, — наверное, мы захвачены их генеративными способностями. История про то, что «напиши мне реферат», «дай мне ответ» — наверное, первое, что привлекло внимание людей. На самом деле, большие модели обладают уникальной предсказательной силой. Они умеют очень точно, с высокой степенью вероятности предсказывать следующее слово в последовательности. Когда говорю «слово», и мы все думаем о человеческом языке, но на самом деле нет. Нейросеть генерирует изображение, как наша модель Kandinsky, и сначала оно токенизируется, представляется в виде последовательности символов — токенов. Потом при генерации создаются токены. Модель в какой-то ситуации переводит с русского языка на язык картинок. Может существовать сотни языков разных модальностей. Я бы каждому рекомендовал попробовать, не важно, с чего вы начнете — с генерации картинок или рефератов. Есть очень полезное обратное свойство, когда ты просишь суммаризировать большой текст и объяснить несколько ключевых факторов. Самое главное — пробовать, потому что когда вы попробуете, то поймете, что для вас нет обратной дороги. Вы начнете постепенно использовать этот инструмент в разных областях жизни. Например, попросите его подготовить текст и потом стилистически подредактировать под вас, сэкономите себе кучу времени. Может быть, попросите обработать большой документ и сказать основные мысли, которые в нем содержатся, или подготовить за вас основные выводы. Люди очень быстро начали это делать по всему миру. OpenAI продемонстрировал следующий технологический рывок чуть более полугода назад, а десятки тысяч компаний, десятки млн людей это уже протестировали. Так что главное — начинайте пробовать, аппетит придет во время еды.Давайте поговорим о бизнес-модели. Эти чаты работают бесплатно, они — результат капиталоемких разработок. Вы, наверное, знаете как никто, GigaChat наверняка тоже привлекает значительные силы, ресурсы, мощности суперкомпьютера, который имеет «Сбер». Это вываливается на рынок бесплатно, но я начинаю думать, что бесплатный сыр должен быть в мышеловке, и через эти чаты меня должны подсадить на что-то, что будет давать деньги.Андрей Белевцев: Уже сейчас на примере разных компаний мы видим, что создаются модели монетизации. Например, модель для профессионального использования. Когда ты обращаешься как частный человек и просишь сгенерировать ответы на вопросы, обработать тексты, у тебя не очень много запросов, и проблем с этим не возникает. Но если компания хочет перевести взаимодействие своих клиентов, она начинает извлекать из этого выгоду и с точки зрения скорости обработки, и с точки зрения качества взаимодействия с пользователями. Возникает определенная стоимость профессионального использования. В ближайшие полтора-два года, а скорее всего, раньше, во все наши форматы взаимодействия с бизнесом, человека и сервиса, бизнес-контрагента, в любой тип взаимодействия с клиентом обязательно будут встроены большие модели. Все наше взаимодействие с миром очень скоро будет строиться через них. Уже они будут думать, какой правильный продукт или услугу подобрать, как к ней обратиться. Модель же может не только создавать текст, а еще делать вызов программного интерфейса или сервиса, заказывать товары или продукты.Это уже портал в целую систему бизнес-отношений.Андрей Белевцев: Безусловно, причем мультимодальный. Нам же удобно общаться по-разному. Иногда голосом, иногда текстом, пишем друг другу сообщения, иногда считаем, что лучший способ передать информацию — визуальный, и рисуем слайды презентации, картинки, чтобы лучше объяснить свою мысль. Большие модели все это умеют.Грандиозный успех OpenAI подстегнул вас форсировать и делать похожую вещь под названием GigaChat или вы развивали подобное и сами? Или сейчас все должны показать возможности в этом направлении?Андрей Белевцев: В прошлом году появился удивительный эффект. Основы архитектуры, на которой работает OpenAI, были известны уже давно и предложены изначально компанией Google. В «Сбере» были разработки — модель RuGPT-3, которая использовала эти архитектуры. У нас есть другие модели, например, FRED-T5 в начале этого года стала лучшей моделью по распознаванию русского языка. Конечно, было много доработок. Что произошло в работе OpenAI? Они натолкнулись на такое свойство сложных технических систем как эмерджентность. Сложная техническая система — это когда совокупность элементов начинает обладать новыми свойствами, не присущими ни одному из составляющих ее элементов. Эмерджентность — это свойство, когда с ростом размера самой системы она начинает обладать новыми свойствами, которыми она в меньших размерах не обладала. Что произошло в исследовательской работе OpenAI, а это изначально исследовательская организация: увеличивая размеры, они натолкнулись на свойство эмерджентности на практике. Они увидели, что модели из просто интересных генеративных «болталок» начинают с очень высокой точностью, крайне напоминающей человеческую, создавать ответы на вопросы, переписывать тексты и так далее.То есть заранее предсказать, что система может заработать на каком-то витке именно так, было нельзя?Андрей Белевцев: Они сами говорят: двигаясь по пути исследования, они не знали, что в этот момент и на этой размерности достигнут такого технологического скачка. Поэтому, если говорить про «Сбер», мы, безусловно, бенефициары того, что давно работали в этом направлении. Наверное, плохо, что не мы первые дошли до такого эмерджентного эффекта. Сейчас все кусают себе локти. Нас это подхлестывает больше инвестировать в RnD (Research and Development) и активнее туда идти. Потому что мы понимаем, что развитие следующих этапов требует постоянных исследований.OpenAI тоже постоянно идут вперед, их система обучается, потому что все больше людей ее используют, она получает все больше информационного сырья. Есть ли шанс догнать?Андрей Белевцев: Мне кажется, ситуация не безнадежная, потому что очень активно совершенствуются и архитектуры. Разработки, которые у нас сейчас есть, становятся архитектурно интереснее, чем архитектуры, которые закладывались некоторое время назад. Но вы правы: привлечение к работе большого количества пользователей — ключевой фактор для любой компании, которая занимается большими моделями. Еще одна технология, которая всем помогает — RL (Reinforcement Learning) HF (With Human Feedback). Фидбэк от человека, который структурированно говорит, хороши или плохи результаты генерации, очень сильно помогает.То есть, они заводят в систему свои данные. Это и есть бесплатный сыр, потому что система дальше впитывает эти информационные ресурсы.Андрей Белевцев: Да, в этом есть определенная ценность.Она открытая потому, что если бы она находилась в замкнутом контуре, по подписке, не смогла бы сама себя развивать?Андрей Белевцев: С одной стороны, да. С другой — не все вопросы и ответы используют для обучения базовой модели, и [нет такого, что] мы все сливаем свои страшные данные. Большинство пользователей взаимодействует с моделями в диалоговом режиме.Данные — это наш образ мыслей.Андрей Белевцев: Наш диалог, как мы взаимодействуем, общаемся между собой. В этом смысле язык — крайне эффективное выразительное средство. Пользуясь средствами естественного языка, мы можем выразить практически любое понятие. Это то, что человечество создало для нашей коммуникации.Как догонять? OpenAI сейчас явный лидер рынка. Пока еще не вполне понятно, как это будет всеми коммерциализироваться, как фактически Microsoft использует эту появившуюся возможность, как потом «Сберу» встроить это в его бизнес? У вас уже есть план?Андрей Белевцев: План, безусловно, должен быть. Вы можете его корректировать, но вы должны понимать, что делать. Если говорить про «догонять», разрыв пока вполне обозрим, по некоторым направлениям сокращается. Потому что даже сейчас на определенных доменах знаний наша модель GigaChat в вопросах на финансовую тематику в наших тестах-сравнениях уже выступает на одинаковом уровне с ChatGPT — 50/50. Есть даже отдельные домены, связанные с юридической тематикой, где мы активно развиваемся, и специализированные по России, где мы в силу специализации превосходим эти модели. Я думаю, что уже ближайшие версии, которые мы сможем выводить этим летом в продуктивное использование на большие аудитории, уже достигают и превосходят ChatGPT. Другое дело, что после ChatGPT уже появилась модель GPT-4, гонка очень активная, но разрыв между технологиями составляет иногда, может быть, месяц.У китайцев есть что-то похожее?Андрей Белевцев: Китайцы сделали почти 70 разных языковых моделей, с которыми они сейчас экспериментируют. В промышленном использовании для массовой публики у них доступны далеко не все модели. Китайцы действуют очень поступательно, они постепенно производят раскатку своих моделей, тестируют разные бизнес-кейсы, но это сейчас правильный подход. Все понимают, что это фундаментальная технология, которой страна и компании должны обладать, и очень немногие компании справятся с тем, чтобы ее создать. Нужно очень многое.Что нужно уникального, чтобы играть на этом поле?Андрей Белевцев: Три вещи. Технологически сильная команда, люди — это у нас есть. Должен быть технологический задел, о котором я говорил; очень важное направление — вычислительные мощности, потому что эти модели требуют очень больших мощностей для обучения, по сути, мы опять находимся в эпохе, когда суперкомпьютеры становятся важными для бизнеса. Третья составляющая — нужны хорошие наборы структурированных данных, потому что в модель, даже с замечательной современной архитектурой, нельзя заливать мусор. У «Сбера» все три вещи есть и на очень высоком уровне. Поэтому мы и «Яндекс» — вот две российские компании, которые способны сделать такую модель. Мы сделали и активно развиваем.Поскольку это очень сложный продукт, не будет ли кооперации, не рассматривалось ли хотя бы теоретически, что, может быть, надо объединить усилия со вторым крупнейшим игроком?Андрей Белевцев: Сама технология — это интересная область для конкуренции, и всегда хорошо, когда на рынке есть соперничество.Два-три года назад все говорили, что мы сильно отстаем в создании собственных облаков и предоставлении облачных сервисов бизнесу. Как сейчас обстоят дела в этом направлении?Андрей Белевцев: Во всем мире облачные решения являются основой технологии первого выбора не только для малого и среднего бизнеса, но и для крупных корпораций. Это в существенной мере предопределяет более низкие издержки в развитии технологий, более высокую скорость распространения технологий и дает возможность активно переиспользовать технологические решения между компаниями. У нас долгое время существовал ментальный блок, особенно это проявлялось в крупных компаниях. Каждый старался сам у себя: «сейчас я все сделаю, повторю». Когда говорят про потребность в большом количестве программистов, я считаю, что это прямое следствие проблемы, когда каждый пытается сделать все сам для себя. Он пытается найти невероятное число программистов. Эти развилки многие страны уже прошли, не надо повторно разрабатывать то, что уже сделали другие. Облака дают возможность подключиться и не строить собственную инфраструктуру, платить только за фактическое использование. Использовать прикладные облачные решения, не разрабатывая их, и все свои усилия сконцентрировать только на том, чтобы приносить добавленную стоимость и ценность для ее клиента, а не размазывать свои всегда ограниченные менеджерские и интеллектуальные ресурсы по всему технологическому стеку. Поэтому я верю только в развитие облачных технологий, мы постараемся сделать в этом году много технологических предложений.Может ли железная дорога не иметь своего вычислительного центра, который полностью рассчитывает расписание, продажу билетов, безопасность, потребление ресурсов в привязке ко всему, а пользоваться предложенным в облаке продуктом, который решает все эти задачи?Андрей Белевцев: Конечно может. Говорю с уверенностью, недавно у меня был разговор на эту тему.Какие из российских компаний отказались от собственного программного обеспечения, может, «Московский транспорт»?Андрей Белевцев: Простой пример из своего хозяйства. У нас есть дочерняя организация «Сбертех», «Сбербанк технологии». Это крупнейший разработчик программного обеспечения, несколько тысяч человек работает и делает все базовые технологии, которые мы потом используем в «Сбере». У них нет собственной инфраструктуры, все бизнес-процессы и всю свою работу ведут только в облаке.Это облако «Сбера»?Андрей Белевцев: Уже не совсем так.Берет ли «Сбер» совершенно чужие программные продукты из облаков, или, допустим, это ваше облако и там все в любом случае знакомое, понятное, контролируемое?Андрей Белевцев: Исторически, конечно, да. Сейчас идет этап перестройки. Я говорю «исторически», потому что в основном вся финансовая информация, все торговые терминалы всегда не находились внутри твоей инфраструктуры, ты всегда работал с ними как с внешним программным интерфейсом разными способами. Конечно, мир же весь очень сильно соединен между собой, ты не можешь весь мир затащить в одну маленькую коробочку, это наша ментальность в голове. Нам кажется, что если мы стоящий в комнате сервер закроем на ключ, то он в безопасности. Но это не так, на самом деле он всегда подключен к внешним каналам связи. Важно, существует ли у вас подразделение, обеспечивающее на должном уровне кибербезопасность, кто вообще проектировал это решение.Хоть один банк готов подключиться, например, к каким-то облакам «Сбера», в которых находятся программные сервисы для осуществления банковской деятельности, программы скоринга?Андрей Белевцев: Есть в том числе и крупные банки, которые из облака пользуются и нашими технологиями распознавания речи. Наша платформа NLP используется в «Салюте», а по сути, это облачное решение, где надо обратиться к программному интерфейсу и получить ответ. Конечно, да, просто очень точечно. Я надеюсь, что в текущей ситуации мы сможем извлечь уроки, что все более открыто на это посмотрят и поймут, что хорошо спроектированное и надежно защищаемое с точки зрения всех видов безопасности облако может оказаться лучшим решением. Сейчас огромное количество компаний переделывают или думают, как переделать свою инфраструктуру, которая у них осталась без поддержки и развития, когда как эти решения нужно принимать не сейчас.Что касается облаков. Они теперь должны быть у нас суверенные. Это очень много железа. Мы способны технологически наращивать эту отрасль?Андрей Белевцев: «Сбер» последние два года был участником важного для государства эксперимента — разработки платформы «Гостех». В 2022 году поставили задачу добиться полного импортозамещения вертикально — от оборудования, управления сетевыми ресурсами и средствами защиты информации и до прикладного уровня. Эту задачу выполнили. Мы вкладывались не очень много, и сейчас мы, наверное, первая компания, которая точно знает, как это сделать, и сделала это, прошла все необходимые аттестации и получила все нужные аттестаты безопасности этих систем, выполняя эту работу в интересах государства. Эксперимент в феврале этого года признали успешным, поэтому сейчас мы готовы помочь любому корпоративному заказчику помочь пройти эту работу на технологиях, которыми мы обладаем.Где мы возьмем железо в таком количестве?Андрей Белевцев: У нас есть. Надо заглянуть в реестр Минпромторга. По большинству позиций номенклатуры есть решения, которые соответствуют требованиям локализации Минпромторга.Мы можем произвести эти серверы на территории РФ?Андрей Белевцев: Очень и очень многие. У нас есть два вызова. Первый — уровень зрелости многих технологических решений в аппаратной сфере еще не такой большой, поэтому, когда ты строишь инфраструктуру, используя эти решения, в первое время количество инцидентов выше, чем в более апробированных решениях. Здесь дорогу осилит идущий. Нам важно быть в диалоге с государством и правильно выбирать риск-ориентированный подход. Не создавать себе новых рисков слишком быстрым внедрением тех или иных технологий. Второй вызов — есть сложные области. Например, сейчас нет высокопроизводительных хранилищ данных, в лучшем случае они среднего диапазона. Но здесь есть интересные подходы — эту проблему можно решать на архитектурном уровне софта. Мы сторонники отказа от сверхбольших баз, королем которых был и остается Oracle, и всего этого технологического стека, потому что он уже достиг вершин технологий и там остановился. В «Сбере» он, например, умирает. Мы используем более компактные базы, и это путь, которым идут все крупные мировые компании. Это более надежно и отказоустойчиво и уже не требует ни такого дорогого железа, ни ПО.Вы уже упомянули суперкомпьютер как важнейший элемент решения задач, о которых мы говорили. Насколько он импортонезависим?Андрей Белевцев: Сложный вопрос. Что-то независимо, что-то еще зависимо. Все хотят поговорить на эти темы, и всем я отвечаю только одно: у всех свои коммерческие подходы, как это делается, кто и каким образом это собирает. Мы умеем предоставлять нашим клиентам конечную услугу. Становясь заказчиками в том числе облачных технологий, вы получаете результат, и все проблемы — это не ваша головная боль. Вы перекладываете ее на своего подрядчика.Хорошо. Теперь совсем простой предмет — банкомат, который «Сбер» теперь тоже создает сам. Как это делается?Андрей Белевцев: Мы работаем с партнерами по производству железа для банкоматов, но мы сконцентрировались на другом, сделали операционную систему и все системы управления сетью банкоматов. Насколько мне известно, это первая в мире реализация банкоматов на Linux, даже удивительно, почему никто не сделал этого раньше. Почему-то подавляющая часть всего парка банкоматов в мире, какие бы там ни были производители, работали на Windows. Мы показываем людям, можно прийти в наш офис и сравнить: два банкомата будут стоять рядом и выглядеть одинаково, с одинаковым интерфейсом, но если вы попробуете совершить любую операцию, к примеру, снятие наличных, и сделаете это одновременно, то быстрее это выполнит банкомат на Linux. В целом Linux более надежная и безопасная ОС. Тем более раньше в банкоматах часто использовали старые версии Windows. Поэтому получилось, что это и экономически выгоднее, и клиенту удобнее, и еще работает надежнее. Эти решения мы сейчас готовы предлагать и другим банкам. Надеемся, что в этом году у нас появятся клиенты-банки, которые захотят внедрить такую технологию, потому что эта проблема стоит перед всеми в полный рост.