Zbiór danych bengalskich

বাংলা ডেটাসেট

Wysokiej jakości bengalski zestaw danych do obsługi telefonicznej, ogólnych rozmów i podcastów dla modeli AI i mowy

Omówienie

Tytuł (język)

Zbiór danych języka bengalskiego

Typy zbiorów danych

Centrum telefoniczne, Rozmowa ogólna, Dane multimedialne (dane podcastów), Skryptowany monolog

Kraj

India

OPIS

Dostępne są nieskryptowane, syntetyczne rozmowy telefoniczne między agentem a klientem, trwające od 5 do 15 minut. Dodatkowo, dostępne są licencjonowane pliki audio lub wideo z domeny publicznej, takie jak wywiady, podcasty i podobne treści, w których bierze udział od 1 do 5 osób, trwające od 15 do 60 minut.

Przypadek użycia

ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka

Szczegóły zestawu danych

Typ zbioru danych Częstotliwość próbkowania Głośniki Kanał Suma godzin Całkowita liczba głośników
Call Center 8 kHz Głośniki 2 Podwójny 117:03:45 498
Rozmowa ogólna 8 kHz Głośniki 2 Podwójny 168:13:39 458
Dane medialne 16 kHz Wiele głośników Mono 24:58:58 90
Scenariusz Monolog 24 kHz Pojedynczy głośnik Mono 2,300:00:00 Na Życzenie

Wyróżnieni klienci

Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.

Amazon
Google
Microsoft
Skontaktuj się z nami

Nie możesz znaleźć tego, czego szukasz?

Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych

Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy

  • To pole jest dla celów walidacji i powinny być pozostawione bez zmian.
  • Rejestrując się, zgadzam się z Shaip Polityka Prywatności oraz Regulamin i wyrazić zgodę na otrzymywanie komunikacji marketingowej B2B od Shaip.