IDC

Следующие модели Llama от Meta могут иметь улучшенные голосовые функции

Image

Сообщается, что Meta уделяет особое внимание предоставлению пользователям возможности прерывать модель во время речи, аналогично голосовому режиму OpenAI для ChatGPT и опыту Gemini Live от Google.

В своих комментариях на конференции Morgan Stanley на этой неделе директор по продуктам компании Meta Крис Кокс сказал, что Llama 4 будет «универсальной» моделью, способной нативно интерпретировать и выводить речь, а также текст и другие типы данных.

Успех открытых моделей китайской лаборатории искусственного интеллекта DeepSeek, которые работают на уровне или лучше моделей Llama от Meta, подтолкнул разработку Llama к ускорению. Говорят, что Meta попыталась организовать военные комнаты, чтобы разобраться, как DeepSeek снизила стоимость запуска и развертывания моделей.

16
Начать обсуждение

Рекомендации

Сооснователь Google Ларри Пейдж запустил ИИ-стартап в сфере промышленности — The Information

ИИ собираются использовать для повышения эффективности производства.
Читать далее
28

Stability AI выпускает модель преобразования текста в звук, которая работает на мобильных устройствах

Stability AI и Arm выпустили компактную модель преобразования текста в звук, которая работает на смартфонах и способна генерировать стереофонические аудиоклипы продолжительностью до 11 секунд примерно за 7 секунд.
Читать далее
32

OpenAI и Amazon заключили семилетнюю сделку на $38 млрд, чтобы улучшить работу ChatGPT

OpenAI заключила соглашение о покупке мощностей Amazon на сумму $38 млрд для улучшения работы чат-бота ChatGPT. Сделка стала признаком того, что OpenAI сокращает зависимость от Microsoft, пишет CNBC. В соответствии с соглашением OpenAI немедленно начнёт выполнять рабочие нагрузки на инфраструктуре Amazon Web Services, используя вычислительные мощности графических процессоров Nvidia в США.
Читать далее
5

OpenAI добавила GPT-4.1 в ChatGPT

Для платных пользователей.
Читать далее
38

OpenAI выпустила модели для озвучивания текста и создания голосовых помощников с поддержкой русского языка

Они доступны разработчикам и в бесплатной демоверсии.
Читать далее
26

Какой ChatGPT выбрать в 2025 году? Подробный разбор всех моделей

Ещё пару лет назад вопрос «Какой ChatGPT лучше?» сводился к простому выбору: что за версию использовать — «тройку» или «четвёрку»? Теперь всё сложнее, и не всегда с ходу понятно, чем одна модель отличается от другой. OpenAI больше не делает ставку на одну универсальную, а предлагает линейки моделей, где каждая специализируется на чём‑то своём: одна лучше рассуждает, другой удобнее писать код, третья идеально подходит для повседневных задач (генераций и др.).
Читать далее
44

Sesame AI демонстрирует впечатляющего голосового помощника с открытым исходным кодом

Sesame AI, калифорнийский стартап, использует нетрадиционный подход к голосовому ИИ, намеренно добавляя дефекты в свою речь. Их новая модель представляет собой первый шаг к более аутентичным диалогам и тому, что они называют «присутствием голоса» в системах ИИ.
Читать далее
43

Google запустила бесплатный ИИ-сервис Stitch для разработки веб-интерфейсов с помощью Gemini 2.5 Pro

Собрали примеры пользователей из соцсетей.
Читать далее
54