Zbiór danych suahili
Hifadhidata i Kiswahili
Wysokiej jakości zbiór danych z centrum telefonicznej obsługi klienta i mediów w języku suahili (podcast) dla modeli sztucznej inteligencji i mowy
Przegląd
Tytuł (język)
Zestaw danych języka suahili
Typy zbiorów danych
Call Center, Media (Podcast)
Kraj
Tanzania, Kenia i Uganda
OPIS
Zbiór danych obejmuje nieskryptowane rozmowy telefoniczne między agentem syntetycznym a klientem (5–15 minut) oraz licencjonowane pliki audio lub wideo należące do domeny publicznej, takie jak wywiady i podcasty z udziałem 1–5 uczestników (15–60 minut).
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
| Typ zbioru danych | Częstotliwość próbkowania | Głośniki | Kanał | Suma godzin | Całkowita liczba głośników |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Głośniki 2 | Podwójny | 229:59:55 | 544 |
| Muzyka | 16 kHz | Wiele głośników | Mono | 264:34:45 | 636 |
Wyróżnieni klienci
Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.
Nie możesz znaleźć tego, czego szukasz?
Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych
Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy