Zbiór danych bengalskich
বাংলা ডেটাসেট
Wysokiej jakości bengalski zestaw danych do obsługi telefonicznej, ogólnych rozmów i podcastów dla modeli AI i mowy
Omówienie
Tytuł (język)
Zbiór danych języka bengalskiego
Typy zbiorów danych
Centrum telefoniczne, Rozmowa ogólna, Dane multimedialne (dane podcastów), Skryptowany monolog
Kraj
India
OPIS
Dostępne są nieskryptowane, syntetyczne rozmowy telefoniczne między agentem a klientem, trwające od 5 do 15 minut. Dodatkowo, dostępne są licencjonowane pliki audio lub wideo z domeny publicznej, takie jak wywiady, podcasty i podobne treści, w których bierze udział od 1 do 5 osób, trwające od 15 do 60 minut.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
| Typ zbioru danych | Częstotliwość próbkowania | Głośniki | Kanał | Suma godzin | Całkowita liczba głośników |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Głośniki 2 | Podwójny | 117:03:45 | 498 |
| Rozmowa ogólna | 8 kHz | Głośniki 2 | Podwójny | 168:13:39 | 458 |
| Dane medialne | 16 kHz | Wiele głośników | Mono | 24:58:58 | 90 |
| Scenariusz Monolog | 24 kHz | Pojedynczy głośnik | Mono | 2,300:00:00 | Na Życzenie |
Wyróżnieni klienci
Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.
Nie możesz znaleźć tego, czego szukasz?
Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych
Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy