Zbiór danych kannada
ಕನ್ನಡ ಡೇಟಾಸೆಟ್
Wysokiej jakości kannadajskie centrum telefoniczne, rozmowy ogólne, monologi skryptowe i zbiór danych medialnych (podcast) dla modeli AI i mowy
Przegląd
Tytuł (język)
Zestaw danych języka kannada
Typy zbiorów danych
Centrum telefoniczne, Rozmowa ogólna, Dane multimedialne, Skryptowany monolog
Kraj
India
OPIS
Zbiór danych obejmuje nieskryptowane rozmowy telefoniczne między agentem syntetycznym a klientem (5–15 minut), licencjonowane pliki audio lub wideo z domeny publicznej, takie jak wywiady i podcasty z udziałem od 1 do 5 uczestników (15–60 minut), a także skryptowane monologi, w których jeden mówca wygłasza wstępnie zdefiniowaną treść służącą do szkolenia i oceny modeli mowy i języka.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
| Typ zbioru danych | Częstotliwość próbkowania | Głośniki | Kanał | Suma godzin | Całkowita liczba głośników |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Głośniki 2 | Podwójny | 59:57:02 | 494 |
| Call Center | 16 kHz | Głośniki 2 | Mono | 195:26:56 | 9,504 |
| Rozmowa ogólna | 8 kHz | Głośniki 2 | Podwójny | 141:27:15 | 424 |
| Dane medialne | 16 kHz | Wiele głośników | Mono | 14:19:52 | 124 |
| Scenariusz Monolog | 24 kHz | Pojedynczy głośnik | Mono | 500:00:00 | Na Życzenie |
Wyróżnieni klienci
Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.
Nie możesz znaleźć tego, czego szukasz?
Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych
Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy