Chiński angielski zestaw danych
中英文数据集
Wysokiej jakości chińsko-angielski zestaw danych call-center i podcastów dla modeli AI i mowy
Zakładka Podgląd
Tytuł
Chiński angielski Zbiór danych języka
Typ zbioru danych
Centrum telefoniczne
Opis
Nieskryptowana, syntetyczna rozmowa telefoniczna między „agentem” a „klientem”, ok. Czas trwania dźwięku (zakres) 5-15 minut.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
Suma godzin
169
Próbna stawka
8 kHz
Kanał audio
Podwójny
Platforma nagrywania
Stacjonarny
Audio Format
. Wav
Format transkrypcji
.json
WER (%)
5
Demografia zbioru danych
Państwo
Chiny
Wybierz język
Chiński angielski
Płeć
Kobieta 1790, Mężczyzna 523, Nieznane 13
Ilość głośników
2,326
Wiek
18-50
Zakładka Podgląd
Tytuł
Chiński angielski Zbiór danych języka
Typ zbioru danych
Podcast
Opis
Licencjonowane pliki audio/wideo należące do domeny publicznej, takie jak wywiady, podcasty itp. — od 1 do 5 osób. Około. Czas trwania dźwięku (zakres) 15-60 minut.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
Suma godzin
249
Próbna stawka
16 kHz
Kanał audio
Mono
Platforma nagrywania
Pozyskiwanie sieciowe
Audio Format
. Wav
Format transkrypcji
.json
WER (%)
5
Demografia zbioru danych
Państwo
Chiny
Wybierz język
Chiński angielski
Płeć
Kobieta 126, Mężczyzna 346, Nieznane 6
Ilość głośników
478
Wiek
18-50
Zakładka Podgląd
Tytuł
Wuhan Zbiór danych języka
Typ zbioru danych
Spontaniczny dialog
Suma godzin
500
Próbna stawka
16 kHz
chiński Zbiór danych języka
TTS
300
16 kHz
Hokkienese Zbiór danych języka
Spontaniczny dialog
100
16 kHz
Szanghaj Zbiór danych języka
Spontaniczny dialog
500
16 kHz
Syczuan Zbiór danych języka
Spontaniczny dialog
500
16 kHz
angielski (chiński) Zbiór danych języka
Skrypt Spontaniczny
2,000
16 kHz
Wyróżnieni klienci
Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.

Nie możesz znaleźć tego, czego szukasz?
Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych
Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy