Chiński zestaw danych
简体中文数据集
Wysokiej jakości chiński zbiór danych dla modeli sztucznej inteligencji i mowy
Przegląd
Tytuł (język)
Zestaw danych języka chińskiego
Typy zbiorów danych
Centrum telefoniczne, muzyka, monolog scenariuszowy, dane multimedialne (dane podcastów)
Kraj
Chiny
OPIS
Zbiór danych obejmuje nieskryptowane rozmowy telefoniczne między agentem syntetycznym a klientem (5–15 minut), naturalne rozmowy telefoniczne między ludźmi (15–60 minut) oraz nagrania śpiewu z transkrypcjami, dostarczając różnorodnych danych głosowych do szkolenia i oceny technologii mowy i języka.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
| Wybierz język | Typ zbioru danych | Częstotliwość próbkowania | Głośniki | Kanał | Suma godzin | Całkowita liczba głośników |
|---|---|---|---|---|---|---|
| Chiński śpiew | Muzyka | 48 kHz | Pojedynczy głośnik | Mono | 06:11:32 | 10 |
| Chiński (tradycyjny) | Scenariusz Monolog | 48 kHz | Pojedynczy głośnik | Mono | 1,499:00:00 | 1,805 |
| Angielski z akcentem chińskim | Dane medialne | 16 kHz | Wiele głośników | Mono | 306:04:58 | 2,130 |
| Chiński uproszczony | Scenariusz Monolog | 48 kHz | Pojedynczy głośnik | Mono | 2,761:00:00 | 3,725 |
| Chiński, angielski z amerykańskim akcentem | Call Center | 8 kHz | Głośniki 2 | Podwójny | 152:18:33 | 2,058 |
| Chiński, angielski z amerykańskim akcentem | Dane medialne | 16 kHz | Wiele głośników | Mono | 245:55:15 | 468 |
Wyróżnieni klienci
Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.
Nie możesz znaleźć tego, czego szukasz?
Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych
Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy