Tajski zbiór danych
ชุดข้อมูลภาษาไทย
Wysokiej jakości zbiór danych dotyczących ogólnych konwersacji w języku tajskim, monologów skryptowych i podcastów medialnych dla modeli sztucznej inteligencji i mowy
Przegląd
Tytuł (język)
Zestaw danych języka tajskiego
Typy zbiorów danych
Rozmowy ogólne, Media (podcast), Scenariusz monologu
Kraj
Tajlandia
OPIS
Zbiór danych obejmuje nieskryptowane rozmowy telefoniczne między dwojgiem osób z Izraela w języku hebrajskim (15–60 minut), licencjonowane pliki audio lub wideo należące do domeny publicznej z udziałem od 1 do 5 uczestników (15–60 minut) oraz skryptowane monologi, w których jeden mówca wygłasza wstępnie zdefiniowaną treść służącą do szkolenia i oceny modeli mowy i języka.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
| Typ zbioru danych | Częstotliwość próbkowania | Głośniki | Kanał | Suma godzin | Całkowita liczba głośników |
|---|---|---|---|---|---|
| Rozmowa ogólna | 8 kHz | Głośniki 2 | Podwójny | 211:48:42 | 170 |
| Dane medialne | 16 kHz | Pojedynczy głośnik | Mono | 249:14:31 | 670 |
| Scenariusz Monolog | 24 kHz | Pojedynczy głośnik | Mono | 500:00:00 | Na Życzenie |
Wyróżnieni klienci
Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.
Nie możesz znaleźć tego, czego szukasz?
Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych
Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy