Zbiór danych tamilskich

தமிழ் தரவுத்தொகுப்பு

Odblokuj moc zestawów danych mowy tamilskiej dla ASR, TTS i konwersacyjnej AI. Shaip oferuje najwyższej jakości zestawy danych audio tamilskiego, aby szkolić inteligentniejsze modele językowe.

Przegląd

Tytuł (język)

Zbiór danych języka tamilskiego

Typy zbiorów danych

Centrum telefoniczne, Rozmowa ogólna, Dane multimedialne, Skryptowany monolog

Kraj

India

OPIS

Zbiór danych obejmuje nieskryptowane rozmowy agenta syntetycznego z klientem (5–15 minut), naturalne rozmowy telefoniczne między ludźmi (15–60 minut) oraz dane multimedialne z transkrypcjami, oferując różnorodne dane głosowe do szkolenia i oceny technologii mowy i języka.

Przypadek użycia

ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka

Szczegóły zestawu danych

Typ zbioru danych Częstotliwość próbkowania Głośniki Kanał Suma godzin Całkowita liczba głośników
Call Center 8 kHz Głośniki 2 Podwójny 124:23:52 484
Call Center 16 kHz Głośniki 2 Mono 199:44:21 1,986
Rozmowa ogólna 8 kHz Głośniki 2 Podwójny 101:42:05 440
Rozmowa ogólna 48 kHz Głośniki 2 Mono 80:21:16 141
Dane medialne 16 kHz Wiele głośników Mono 43:07:01 32
Scenariusz Monolog 24 kHz Pojedynczy głośnik Mono 500:00:00 Na Życzenie

Wyróżnieni klienci

Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.

Amazon
Google
Microsoft
Skontaktuj się z nami

Nie możesz znaleźć tego, czego szukasz?

Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych

Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy

  • To pole jest dla celów walidacji i powinny być pozostawione bez zmian.
  • Rejestrując się, zgadzam się z Shaip Polityka Prywatności oraz Regulamin i wyrazić zgodę na otrzymywanie komunikacji marketingowej B2B od Shaip.