Zbiór danych hindi
हिंदी डेटासेट
Wysokiej jakości zbiór danych do obsługi telefonicznej w języku hindi, rozmów ogólnych i podcastów dla modeli AI i ASR
Przegląd
Tytuł (język)
Zestaw danych języka hindi
Typy zbiorów danych
Centrum telefoniczne, Rozmowy ogólne, Media (podcast), Scenariusz monologu
Kraj
India
OPIS
Dostępne są nieskryptowane rozmowy telefoniczne między dwojgiem ludzi o długości od 15 do 60 minut, a także licencjonowane pliki audio lub wideo z domeny publicznej, takie jak wywiady i podcasty z udziałem od 1 do 5 osób o podobnym czasie trwania. Dodatkowo, nagrania pojedynczych wypowiedzi trwają zazwyczaj od 5 do 30 sekund, a dostępne są również dane dotyczące monologów ze skryptem.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
| Typ zbioru danych | Częstotliwość próbkowania | Głośniki | Kanał | Suma godzin | Całkowita liczba głośników |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Głośniki 2 | Podwójny | 70:45:51 | Na Życzenie |
| Call Center | 8 kHz | Głośniki 2 | Mono | 20,000:00:00 | Na Życzenie |
| Call Center | 16 kHz | Głośniki 2 | Mono | 29:17:20 | 261 |
| Call Center | 16 kHz | Głośniki 2 | Podwójny | 400:27:10 | 1200 |
| Rozmowa ogólna | 8 kHz | Głośniki 2 | Podwójny | 47:48:40 | 224 |
| Dane medialne | 16 kHz | Wiele głośników | Mono | 227:57:43 | 438 |
| Scenariusz Monolog | 48 kHz | Pojedynczy głośnik | Mono | 2,866:00:00 | 3,988 |
| Scenariusz Monolog | 24 kHz | Pojedynczy głośnik | Mono | 29,000:00:00 | Na Życzenie |
Wyróżnieni klienci
Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.
Nie możesz znaleźć tego, czego szukasz?
Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych
Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy