Zbiór danych Hinglisha
हिंगलिश डाटासेट
Wysokiej jakości zbiór danych Hinglish Call-Center i podcastów dla modeli AI i mowy
Przegląd
Tytuł (język)
Zestaw danych języka hinglish
Typy zbiorów danych
Call Center, dane medialne
Kraj
India
OPIS
Dostępne są nieskryptowane, syntetyczne rozmowy telefoniczne między agentem a klientem trwające od 5 do 15 minut, natomiast licencjonowane pliki audio lub wideo należące do domeny publicznej, takie jak wywiady i podcasty z udziałem od 1 do 5 uczestników, trwają zazwyczaj od 15 do 60 minut.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
| Typ zbioru danych | Częstotliwość próbkowania | Głośniki | Kanał | Suma godzin | Całkowita liczba głośników |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Głośniki 2 | Podwójny | 240:54:06 | 2404 |
| Dane medialne | 16 kHz | Głośniki Multipal | Mono | 144:15:36 | 317 |
Wyróżnieni klienci
Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.
Nie możesz znaleźć tego, czego szukasz?
Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych
Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy