Zbiór danych suahili
Hifadhidata i Kiswahili
Wysokiej jakości suahilijski zestaw danych call-center i podcastów dla modeli AI i mowy
Zakładka Podgląd
Tytuł
suahili Zbiór danych języka
Typ zbioru danych
Centrum telefoniczne
Opis
Nieskryptowana, syntetyczna rozmowa telefoniczna między „agentem” a „klientem”, ok. Czas trwania dźwięku (zakres) 5-15 minut.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
Suma godzin
230
Próbna stawka
8 kHz
Kanał audio
Podwójny
Platforma nagrywania
Stacjonarny
Audio Format
. Wav
Format transkrypcji
.json
WER (%)
5
Demografia zbioru danych
Państwo
suahili
Wybierz język
suahili
Płeć
Kobieta 611, Mężczyzna 833, Nieznane 0
Ilość głośników
1,444
Wiek
18-50
Zakładka Podgląd
Tytuł
suahili Zbiór danych języka
Typ zbioru danych
Podcast
Opis
Licencjonowane pliki audio/wideo należące do domeny publicznej, takie jak wywiady, podcasty itp. — od 1 do 5 osób. Około. Czas trwania dźwięku (zakres) 15-60 minut.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
Suma godzin
265
Próbna stawka
16 kHz
Kanał audio
Mono
Platforma nagrywania
Pozyskiwanie sieciowe
Audio Format
. Wav
Format transkrypcji
.json
WER (%)
5
Demografia zbioru danych
Państwo
suahili
Wybierz język
suahili
Płeć
Kobieta 118, Mężczyzna 493, Nieznane 25
Ilość głośników
636
Wiek
18-50
Wyróżnieni klienci
Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.

Nie możesz znaleźć tego, czego szukasz?
Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych
Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy