Malajski zbiór danych

Ustaw Melayu danych

Wysokiej jakości zestaw danych do obsługi telefonicznej w języku malajskim, rozmów ogólnych i podcastów dla modeli AI i mowy

Przegląd

Tytuł (język)

Zbiór danych języka malajskiego

Typy zbiorów danych

Centrum telefoniczne, Rozmowy ogólne, Dane multimedialne (dane podcastów)

Kraj

Malezja, Indonezja, Brunei i Singapur

OPIS

Dostępne są nieskryptowane rozmowy telefoniczne między dwojgiem ludzi w języku malajskim z Malezji o długości od 15 do 60 minut, a także licencjonowane pliki audio lub wideo należące do domeny publicznej, takie jak wywiady i podcasty z udziałem od 1 do 5 uczestników, również o długości od 15 do 60 minut.

Przypadek użycia

ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka

Szczegóły zestawu danych

Typ zbioru danych Częstotliwość próbkowania Głośniki Kanał Suma godzin Całkowita liczba głośników
Rozmowa ogólna 8 kHz Głośniki 2 Podwójny 239:49:43 432
Rozmowa ogólna 48 kHz Głośniki 2 Mono 90:19:23 140
Dane medialne 16 kHz Głośniki Multipal Mono 343:57:16 907
Call Center 8 kHz Głośniki 2 Mono 2,000:00:00 Na Życzenie

Wyróżnieni klienci

Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.

Amazon
Google
Microsoft
Skontaktuj się z nami

Nie możesz znaleźć tego, czego szukasz?

Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych

Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy

  • To pole jest dla celów walidacji i powinny być pozostawione bez zmian.
  • Rejestrując się, zgadzam się z Shaip Polityka Prywatności oraz Regulamin i wyrazić zgodę na otrzymywanie komunikacji marketingowej B2B od Shaip.