Chiński zestaw danych

简体中文数据集

Wysokiej jakości chiński zbiór danych dla modeli sztucznej inteligencji i mowy

Przegląd

Tytuł (język)

Zestaw danych języka chińskiego

Typy zbiorów danych

Centrum telefoniczne, muzyka, monolog scenariuszowy, dane multimedialne (dane podcastów)

Kraj

Chiny

OPIS

Zbiór danych obejmuje nieskryptowane rozmowy telefoniczne między agentem syntetycznym a klientem (5–15 minut), naturalne rozmowy telefoniczne między ludźmi (15–60 minut) oraz nagrania śpiewu z transkrypcjami, dostarczając różnorodnych danych głosowych do szkolenia i oceny technologii mowy i języka.

Przypadek użycia

ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka

Szczegóły zestawu danych

Wybierz język Typ zbioru danych Częstotliwość próbkowania Głośniki Kanał Suma godzin Całkowita liczba głośników
Chiński śpiew Muzyka 48 kHz Pojedynczy głośnik Mono 06:11:32 10
Chiński (tradycyjny) Scenariusz Monolog 48 kHz Pojedynczy głośnik Mono 1,499:00:00 1,805
Angielski z akcentem chińskim Dane medialne 16 kHz Wiele głośników Mono 306:04:58 2,130
Chiński uproszczony Scenariusz Monolog 48 kHz Pojedynczy głośnik Mono 2,761:00:00 3,725
Chiński, angielski z amerykańskim akcentem Call Center 8 kHz Głośniki 2 Podwójny 152:18:33 2,058
Chiński, angielski z amerykańskim akcentem Dane medialne 16 kHz Wiele głośników Mono 245:55:15 468

Wyróżnieni klienci

Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.

Skontaktuj się z nami

Nie możesz znaleźć tego, czego szukasz?

Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych

Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy

  • To pole jest dla celów walidacji i powinny być pozostawione bez zmian.
  • Rejestrując się, zgadzam się z Shaip Polityka Prywatności oraz Regulamin i wyrazić zgodę na otrzymywanie komunikacji marketingowej B2B od Shaip.