Polski zbiór danych
Polski zbiór danych
Wysokiej jakości polski TTS i zbiór danych podcastów dla modeli AI i mowy
Zakładka Podgląd
Tytuł
Polski Zbiór danych języka
Typ zbioru danych
Podcast
Opis
Licencjonowane pliki audio/wideo należące do domeny publicznej, takie jak wywiady, podcasty itp. — od 1 do 5 osób. Około. Czas trwania dźwięku (zakres) 15-60 minut.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
Suma godzin
269
Próbna stawka
16 kHz
Kanał audio
Mono
Platforma nagrywania
Pozyskiwanie sieciowe
Audio Format
. Wav
Format transkrypcji
.json
WER (%)
5
Demografia zbioru danych
Państwo
Polska
Wybierz język
Polski
Płeć
Kobieta 173, Mężczyzna 354, Nieznane 6
Ilość głośników
533
Wiek
18-50
Zakładka Podgląd
Tytuł
Polski Zbiór danych języka
Typ zbioru danych
TTS
Opis
Nagrania z pojedynczą wypowiedzią, które zwykle mieszczą się w przedziale od 5 do 30 sekund.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
Suma godzin
1,482
Próbna stawka
48 kHz
Kanał audio
Mono
Platforma nagrywania
Mobile App
Audio Format
. Wav
Format transkrypcji
.json
WER (%)
5
Demografia zbioru danych
Państwo
Polska
Wybierz język
Polski
Płeć
Kobieta 1324, Mężczyzna 701, Nieznane 24
Ilość głośników
2,049
Wiek
18-50
Wyróżnieni klienci
Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.

Nie możesz znaleźć tego, czego szukasz?
Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych
Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy