Zbiór danych w języku angielskim w Nowym Jorku
Zakładka Podgląd
Tytuł
Nowy Jork angielski Zbiór danych języka
Typ zbioru danych
Centrum telefoniczne
Opis
Nieskryptowana, syntetyczna rozmowa telefoniczna między „agentem” a „klientem”, ok. Czas trwania dźwięku (zakres) 5-15 minut.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
Suma godzin
103
Próbna stawka
8 kHz
Kanał audio
Podwójny
Platforma nagrywania
Stacjonarny
Audio Format
. Wav
Format transkrypcji
.json
WER (%)
5
Demografia zbioru danych
Państwo
USA
Wybierz język
Nowy Jork angielski
Płeć
Kobieta 610, Mężczyzna 532, Nieznane 0
Ilość głośników
1,142
Wiek
18-50
Zakładka Podgląd
Tytuł
Nowy Jork angielski Zbiór danych języka
Typ zbioru danych
Rozmowa ogólna
Opis
Nieskryptowana rozmowa telefoniczna między dwojgiem ludzi. Około. Czas trwania dźwięku (zakres) – 15-60 minut.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
Suma godzin
107
Próbna stawka
8 kHz
Kanał audio
Podwójny
Platforma nagrywania
Stacjonarny
Audio Format
. Wav
Format transkrypcji
.json
WER (%)
5
Demografia zbioru danych
Państwo
USA
Wybierz język
Nowy Jork angielski
Płeć
Kobieta 118, Mężczyzna 114, Nieznane 0
Ilość głośników
232
Wiek
18-50
Zakładka Podgląd
Tytuł
Nowy Jork angielski Zbiór danych języka
Typ zbioru danych
Dźwięk multimedialny
Opis
Licencjonowane pliki audio/wideo należące do domeny publicznej, takie jak wywiady, podcasty itp. — od 1 do 5 osób. Około. Czas trwania dźwięku (zakres) 15-60 minut.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
Suma godzin
140
Próbna stawka
16 kHz
Kanał audio
Mono
Platforma nagrywania
Pozyskiwanie sieciowe
Audio Format
. Wav
Format transkrypcji
.json
WER (%)
5
Demografia zbioru danych
Państwo
USA
Wybierz język
Nowy Jork angielski
Płeć
Kobieta 66, Mężczyzna 230, Nieznane 11
Ilość głośników
307
Wiek
18-50
Wyróżnieni klienci
Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.
Nie możesz znaleźć tego, czego szukasz?
Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych
Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy