Gemini Live
программное обеспечение | |
Gemini Live | |
---|---|
Файл:Gemini Live.webp | |
Разработчик | |
Аппаратная платформа | |
Состояние |
в разработке |
Gemini Live — голосовой помощник с искусственным интеллектом, представленный компанией Google 14 мая 2024 как главный конкурент GPT-4o. Использует улучшенную мультимодальную модель искусственного интеллекта, чтобы предложить пользователям более естественное общение в режиме реального времени.
Презентация состоялась на конференции «Google I/O 2024»[1][2]. Разработчики представили новую возможность для ИИ-чат-бота Gemini — функцию Gemini Live, которая позволяет пользователям вести «углублённые» голосовые диалоги с Gemini на своих смартфонах. Одна из ключевых особенностей заключается в том, что пользователи могут прерывать Gemini во время его реплик, чтобы задать уточняющие вопросы, и чат-бот будет адаптироваться к речи пользователя в режиме реального времени. Кроме того, Gemini может видеть и реагировать на окружение пользователя, используя фотографии или видео, снятые камерами смартфонов[3][4].
Сроки запуска — конец 2024 года[5].
История[править]
Gemini Live разработали в рамках проекта DeepMind Project Astra. Он предназначен для работы с текстом, аудио и изображениями в реальном времени. Цель проекта — создать универсального агента для повседневного использования[1].
Разработка стартовала в 2023 году. По состоянию на дату презентации устройство ещё находилось в стадии доработки. Официально объявленная дата выхода — сентябрь 2024 года[3][1], после чего Gemini Live будет адаптироваться и совершенствоваться[6].
Описание[править]
Виртуальный ассистент Gemini Live, как заявляют разработчики, является своеобразным соединением платформы компьютерного зрения Google Lens и виртуального помощника Google Assistant, и их дальнейшая эволюция. На первый взгляд Gemini Live не кажется кардинальным обновлением по сравнению с существующими технологиями. Однако Google утверждает, что система использует новые методы генеративного ИИ, чтобы обеспечить превосходный, менее подверженный ошибкам анализ изображений, и сочетает эти методы с улучшенным речевым движком для более последовательного, эмоционально выразительного и реалистичного многооборотного диалога[3][7][8].
Панируется, что ассистент также сможет самостоятельно работать с Gmail-почтой, в т. ч. отвечать на письма при необходимости, согласно установленным ранее задачам и инструкциям. Также Gemini Live будет взаимодействовать и с другими сервисами Google[2].
— Демис Хассабис (Demis Hassabis), генеральный директор DeepMind: |
|
Для пользователей будет доступен выбор 1 из 10 различных голосов виртуального помощника[9].
Сравнение[править]
Эксперты сравнивают Gemini Live с представленной ранее GPT-4o от OpenAI[10]: ИИ-модель оптимизирована для обработки запросов пользователей практически без задержек, а общение максимально приближено к естественной диалоговой форме[4][9].
Подписка[править]
Google объявила, что Gemini Live, в отличие от многих ИИ, после запуска для массового пользователя не будет бесплатным, ожидаемая стоимость — 20 долларов в месяц[8][5].
Перспективы[править]
По заявлению разработчиков, в перспективе Gemini Live заменит уже привычного Google Ассистента[11], который устарел в техническом плане[4].
Интересные факты[править]
- На презентации разработчики ассистента привели такой пример его использования в быту: допустим, вы забыли, где положили очки, а из-за плохого зрения не можете осмотреть всю комнату. В перспективе достаточно будет взять в руки смартфон и попросить его разыскать пропажу. После этого достаточно будет показать устройству комнату через камеру видеонаблюдения, оно издаст звуковой сигнал как только «увидит» очки и сможет подсчитать, сколько шагов или пасов руками нужно сделать, чтобы найти их и взять в руки. Более того, программе можно будет дать команду следить за очками всегда, в режиме реального времени, и устройство будет отслеживать, где они находятся — на человеке, на столе, в футляре и т. д.[2][12][13][14]
См. также[править]
Примечания[править]
- ↑ 1,0 1,1 1,2 Супер-ИИ для учебы и поддержки, нейросеть для творчества, поиск по видео и мощный процессор — главное с Google I/O. Хайтек (15 мая 2024). Проверено 23 мая 2024.
- ↑ 2,0 2,1 2,2 Мария Микрюкова Google I/O 2024: Gemini 1.5 PRO, генерация видео и все, что анонсировал Google. Cossa.ru (15 мая 2024). Проверено 23 мая 2024.
- ↑ 3,0 3,1 3,2 Kyle Wiggers Google’s Gemini updates: How Project Astra is powering some of I/O’s big reveals. Techcrunch.com (14 мая 2024). Проверено 23 мая 2024.
- ↑ 4,0 4,1 4,2 Владимир Тихонов Достойный ответ GPT-4o: Google представила ИИ-ассистента Gemini Live. Hi-tech.mail.ru (15 мая 2024). Проверено 23 мая 2024.
- ↑ 5,0 5,1 Андрей Созинов Google представила Gemini Live — ИИ-ассистента с памятью, естественной речью и компьютерным зрением. 3dnews.ru (14 мая 2024). Проверено 23 мая 2024.
- ↑ Dean Daley Google unveils Gemini Live, a mobile experience that aims to replace friends. Mobilesyrup.com (14 мая 2024). Проверено 23 мая 2024.
- ↑ Мария Диаз Что такое Gemini Live? Как чат-бот Google в реальном времени конкурирует с GPT-4o. Zdnet.com (14 мая 2024). Проверено 23 мая 2024.
- ↑ 8,0 8,1 Александр Пономарёв Google выпустила ИИ с естественной речью и машинным зрением его назвали Gemini Live. Digitalocean.ru (15 мая 2024). Проверено 23 мая 2024.
- ↑ 9,0 9,1 Google представил Gemini Live – «ответ» на GPT-4o. Infocity.tech (15 мая 2024). Проверено 23 мая 2024.
- ↑ Scott Younker Gemini Live — what features are available now and what is coming soon. Tomsguide.com (16 мая 2024). Проверено 23 мая 2024.
- ↑ Pallav Pathak What is Gemini Live and when will it be available. All Things How (21 мая 2024). Проверено 23 мая 2024.
- ↑ Abner Li ‘Gemini Live’ lets you talk to Gemini as Google demos ‘Project Astra’ on glasses. 9to5google.com (14 мая 2024). Проверено 23 мая 2024.
- ↑ Devindra Hardawar With Gemini Live, Google wants you to relax and have a natural chat with AI. Engadget (14 мая 2024). Проверено 23 мая 2024.
- ↑ Ankita Garg Gemini Live launched to take on OpenAI's GPT-4o: What is it and everything else you need to know. India Today (15 мая 2024). Проверено 23 мая 2024.
![]() | Одним из источников, использованных при создании данной статьи, является статья из википроекта «Рувики» («ruwiki.ru») под названием «Gemini Live», расположенная по адресу:
Материал указанной статьи полностью или частично использован в Циклопедии по лицензии CC-BY-SA 4.0 и более поздних версий. Всем участникам Рувики предлагается прочитать материал «Почему Циклопедия?». |
---|