Zbiór danych tamilskich
தமிழ் தரவுத்தொகுப்பு
Odblokuj moc zestawów danych mowy tamilskiej dla ASR, TTS i konwersacyjnej AI. Shaip oferuje najwyższej jakości zestawy danych audio tamilskiego, aby szkolić inteligentniejsze modele językowe.
Przegląd
Tytuł (język)
Zbiór danych języka tamilskiego
Typy zbiorów danych
Centrum telefoniczne, Rozmowa ogólna, Dane multimedialne, Skryptowany monolog
Kraj
India
OPIS
Zbiór danych obejmuje nieskryptowane rozmowy agenta syntetycznego z klientem (5–15 minut), naturalne rozmowy telefoniczne między ludźmi (15–60 minut) oraz dane multimedialne z transkrypcjami, oferując różnorodne dane głosowe do szkolenia i oceny technologii mowy i języka.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
| Typ zbioru danych | Częstotliwość próbkowania | Głośniki | Kanał | Suma godzin | Całkowita liczba głośników |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Głośniki 2 | Podwójny | 124:23:52 | 484 |
| Call Center | 16 kHz | Głośniki 2 | Mono | 199:44:21 | 1,986 |
| Rozmowa ogólna | 8 kHz | Głośniki 2 | Podwójny | 101:42:05 | 440 |
| Rozmowa ogólna | 48 kHz | Głośniki 2 | Mono | 80:21:16 | 141 |
| Dane medialne | 16 kHz | Wiele głośników | Mono | 43:07:01 | 32 |
| Scenariusz Monolog | 24 kHz | Pojedynczy głośnik | Mono | 500:00:00 | Na Życzenie |
Wyróżnieni klienci
Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.
Nie możesz znaleźć tego, czego szukasz?
Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych
Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy