Tajski zbiór danych

ชุดข้อมูลภาษาไทย

Wysokiej jakości zbiór danych dotyczących ogólnych konwersacji w języku tajskim, monologów skryptowych i podcastów medialnych dla modeli sztucznej inteligencji i mowy

Przegląd

Tytuł (język)

Zestaw danych języka tajskiego

Typy zbiorów danych

Rozmowy ogólne, Media (podcast), Scenariusz monologu

Kraj

Tajlandia

OPIS

Zbiór danych obejmuje nieskryptowane rozmowy telefoniczne między dwojgiem osób z Izraela w języku hebrajskim (15–60 minut), licencjonowane pliki audio lub wideo należące do domeny publicznej z udziałem od 1 do 5 uczestników (15–60 minut) oraz skryptowane monologi, w których jeden mówca wygłasza wstępnie zdefiniowaną treść służącą do szkolenia i oceny modeli mowy i języka.

Przypadek użycia

ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka

Szczegóły zestawu danych

Typ zbioru danych Częstotliwość próbkowania Głośniki Kanał Suma godzin Całkowita liczba głośników
Rozmowa ogólna 8 kHz Głośniki 2 Podwójny 211:48:42 170
Dane medialne 16 kHz Pojedynczy głośnik Mono 249:14:31 670
Scenariusz Monolog 24 kHz Pojedynczy głośnik Mono 500:00:00 Na Życzenie

Wyróżnieni klienci

Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.

Amazon
Google
Microsoft
Skontaktuj się z nami

Nie możesz znaleźć tego, czego szukasz?

Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych

Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy

  • To pole jest dla celów walidacji i powinny być pozostawione bez zmian.
  • Rejestrując się, zgadzam się z Shaip Polityka Prywatności oraz Regulamin i wyrazić zgodę na otrzymywanie komunikacji marketingowej B2B od Shaip.