Google представил AI-технологию для генерации диалогов

06.06.2023

0 13 Время чтения меньше минуты

Google представил Soundstorm, AI-модель для эффективной и неавторегрессивной генерации звука. По сравнению с авторегрессивной генерацией, которая лежит в основе модели AudioLM, SoundStorm может воспроизводить аудио такого же качества, но с улучшенными показателями голоса и звука. И при этом в два раза быстрее – SoundStorm генерирует 30 секунд звука за 0,5 секунды на оборудовании Google TPU-v4.

SoundStorm в паре с системой SPEAR-TTS (берется этап преобразования текста в семантику) может синтезировать высококачественные и естественные диалоги, позволяя контролировать озвучиваемый контент (через транскрипции), голос спикера (через короткие голосовые подсказки) и очередность спикеров (через аннотации в транскрипции ).

Диалог, созданный SoundStorm:

Напомним, работодатели стали указывать в IT-вакансиях навыки владения нейросетями. Эксперты отмечают, что для многих профессий нейросети становятся помощниками, благодаря которым можно снять с себя часть рутинных задач и повысить производительность труда.

Источник

Теги

Читать следующую

Читать следующую

Яндекс обновил поиск по врачам

Google подтвердил, что ссылки для ранжирования уже не так важны

Сбер открыл доступ к нейросети Kandinsky 3.1 для всех пользователей

Россия к 2030 году войдет в пятерку мировых лидеров по развитию ИИ

Авито начинает готовить специалистов в области ИИ

Студенты Яндекса выиграли международную студенческую олимпиаду по программированию

Adfox обновил блок «Маркировка рекламы» в параметрах баннера

Яндекс выпустил новые устройства для умного дома с Алисой: светодиодную ленту и умную розетку

В Дзене появились брендированные статьи

Telegram запустит донаты и продажу стикеров в TON: что анонсировал Павел Дуров на конференции Token 2049

Добавить комментарий Отменить ответ