Gemini Live

Материал из Циклопедии
Перейти к навигации Перейти к поиску
программное обеспечение
Gemini Live
Файл:Gemini Live.webp
Разработчик

Google

Аппаратная платформа

Android

Состояние

в разработке

Gemini Live — голосовой помощник с искусственным интеллектом, представленный компанией Google 14 мая 2024 как главный конкурент GPT-4o. Использует улучшенную мультимодальную модель искусственного интеллекта, чтобы предложить пользователям более естественное общение в режиме реального времени.

Презентация состоялась на конференции «Google I/O 2024»[1][2]. Разработчики представили новую возможность для ИИ-чат-бота Gemini — функцию Gemini Live, которая позволяет пользователям вести «углублённые» голосовые диалоги с Gemini на своих смартфонах. Одна из ключевых особенностей заключается в том, что пользователи могут прерывать Gemini во время его реплик, чтобы задать уточняющие вопросы, и чат-бот будет адаптироваться к речи пользователя в режиме реального времени. Кроме того, Gemini может видеть и реагировать на окружение пользователя, используя фотографии или видео, снятые камерами смартфонов[3][4].

Сроки запуска — конец 2024 года[5].

История[править]

Gemini Live разработали в рамках проекта DeepMind Project Astra. Он предназначен для работы с текстом, аудио и изображениями в реальном времени. Цель проекта — создать универсального агента для повседневного использования[1].

Разработка стартовала в 2023 году. По состоянию на дату презентации устройство ещё находилось в стадии доработки. Официально объявленная дата выхода — сентябрь 2024 года[3][1], после чего Gemini Live будет адаптироваться и совершенствоваться[6].

Описание[править]

Виртуальный ассистент Gemini Live, как заявляют разработчики, является своеобразным соединением платформы компьютерного зрения Google Lens и виртуального помощника Google Assistant, и их дальнейшая эволюция. На первый взгляд Gemini Live не кажется кардинальным обновлением по сравнению с существующими технологиями. Однако Google утверждает, что система использует новые методы генеративного ИИ, чтобы обеспечить превосходный, менее подверженный ошибкам анализ изображений, и сочетает эти методы с улучшенным речевым движком для более последовательного, эмоционально выразительного и реалистичного многооборотного диалога[3][7][8].

Панируется, что ассистент также сможет самостоятельно работать с Gmail-почтой, в т. ч. отвечать на письма при необходимости, согласно установленным ранее задачам и инструкциям. Также Gemini Live будет взаимодействовать и с другими сервисами Google[2].

— Демис Хассабис (Demis Hassabis), генеральный директор DeepMind:

«Мы всегда хотели создать универсального агента, который будет полезен в повседневной жизни. Представьте себе агентов, которые могут видеть и слышать то, что мы делаем, лучше понимать контекст, в котором мы находимся, и быстро реагировать в разговоре, делая темп и качество взаимодействия гораздо более естественными».

Для пользователей будет доступен выбор 1 из 10 различных голосов виртуального помощника[9].

Сравнение[править]

Эксперты сравнивают Gemini Live с представленной ранее GPT-4o от OpenAI[10]: ИИ-модель оптимизирована для обработки запросов пользователей практически без задержек, а общение максимально приближено к естественной диалоговой форме[4][9].

Подписка[править]

Google объявила, что Gemini Live, в отличие от многих ИИ, после запуска для массового пользователя не будет бесплатным, ожидаемая стоимость — 20 долларов в месяц[8][5].

Перспективы[править]

По заявлению разработчиков, в перспективе Gemini Live заменит уже привычного Google Ассистента[11], который устарел в техническом плане[4].

Интересные факты[править]

  • На презентации разработчики ассистента привели такой пример его использования в быту: допустим, вы забыли, где положили очки, а из-за плохого зрения не можете осмотреть всю комнату. В перспективе достаточно будет взять в руки смартфон и попросить его разыскать пропажу. После этого достаточно будет показать устройству комнату через камеру видеонаблюдения, оно издаст звуковой сигнал как только «увидит» очки и сможет подсчитать, сколько шагов или пасов руками нужно сделать, чтобы найти их и взять в руки. Более того, программе можно будет дать команду следить за очками всегда, в режиме реального времени, и устройство будет отслеживать, где они находятся — на человеке, на столе, в футляре и т. д.[2][12][13][14]

См. также[править]

Примечания[править]

  1. 1,0 1,1 1,2 Супер-ИИ для учебы и поддержки, нейросеть для творчества, поиск по видео и мощный процессор — главное с Google I/O. Хайтек (15 мая 2024). Проверено 23 мая 2024.
  2. 2,0 2,1 2,2 Мария Микрюкова Google I/O 2024: Gemini 1.5 PRO, генерация видео и все, что анонсировал Google. Cossa.ru (15 мая 2024). Проверено 23 мая 2024.
  3. 3,0 3,1 3,2 Kyle Wiggers Google’s Gemini updates: How Project Astra is powering some of I/O’s big reveals. Techcrunch.com (14 мая 2024). Проверено 23 мая 2024.
  4. 4,0 4,1 4,2 Владимир Тихонов Достойный ответ GPT-4o: Google представила ИИ-ассистента Gemini Live. Hi-tech.mail.ru (15 мая 2024). Проверено 23 мая 2024.
  5. 5,0 5,1 Андрей Созинов Google представила Gemini Live — ИИ-ассистента с памятью, естественной речью и компьютерным зрением. 3dnews.ru (14 мая 2024). Проверено 23 мая 2024.
  6. Dean Daley Google unveils Gemini Live, a mobile experience that aims to replace friends. Mobilesyrup.com (14 мая 2024). Проверено 23 мая 2024.
  7. Мария Диаз Что такое Gemini Live? Как чат-бот Google в реальном времени конкурирует с GPT-4o. Zdnet.com (14 мая 2024). Проверено 23 мая 2024.
  8. 8,0 8,1 Александр Пономарёв Google выпустила ИИ с естественной речью и машинным зрением его назвали Gemini Live. Digitalocean.ru (15 мая 2024). Проверено 23 мая 2024.
  9. 9,0 9,1 Google представил Gemini Live – «ответ» на GPT-4o. Infocity.tech (15 мая 2024). Проверено 23 мая 2024.
  10. Scott Younker Gemini Live — what features are available now and what is coming soon. Tomsguide.com (16 мая 2024). Проверено 23 мая 2024.
  11. Pallav Pathak What is Gemini Live and when will it be available. All Things How (21 мая 2024). Проверено 23 мая 2024.
  12. Abner Li ‘Gemini Live’ lets you talk to Gemini as Google demos ‘Project Astra’ on glasses. 9to5google.com (14 мая 2024). Проверено 23 мая 2024.
  13. Devindra Hardawar With Gemini Live, Google wants you to relax and have a natural chat with AI. Engadget (14 мая 2024). Проверено 23 мая 2024.
  14. Ankita Garg Gemini Live launched to take on OpenAI's GPT-4o: What is it and everything else you need to know. India Today (15 мая 2024). Проверено 23 мая 2024.
Рувики

Одним из источников, использованных при создании данной статьи, является статья из википроекта «Рувики» («ruwiki.ru») под названием «Gemini Live», расположенная по адресу:

Материал указанной статьи полностью или частично использован в Циклопедии по лицензии CC-BY-SA 4.0 и более поздних версий.

Всем участникам Рувики предлагается прочитать материал «Почему Циклопедия?».