Zbiór danych hindi

हिंदी डेटासेट

Wysokiej jakości zbiór danych do obsługi telefonicznej w języku hindi, rozmów ogólnych i podcastów dla modeli AI i ASR

Przegląd

Tytuł (język)

Zestaw danych języka hindi

Typy zbiorów danych

Centrum telefoniczne, Rozmowy ogólne, Media (podcast), Scenariusz monologu

Kraj

India

OPIS

Dostępne są nieskryptowane rozmowy telefoniczne między dwojgiem ludzi o długości od 15 do 60 minut, a także licencjonowane pliki audio lub wideo z domeny publicznej, takie jak wywiady i podcasty z udziałem od 1 do 5 osób o podobnym czasie trwania. Dodatkowo, nagrania pojedynczych wypowiedzi trwają zazwyczaj od 5 do 30 sekund, a dostępne są również dane dotyczące monologów ze skryptem.

Przypadek użycia

ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka

Szczegóły zestawu danych

Typ zbioru danych Częstotliwość próbkowania Głośniki Kanał Suma godzin Całkowita liczba głośników
Call Center 8 kHz Głośniki 2 Podwójny 70:45:51 Na Życzenie
Call Center 8 kHz Głośniki 2 Mono 20,000:00:00 Na Życzenie
Call Center 16 kHz Głośniki 2 Mono 29:17:20 261
Call Center 16 kHz Głośniki 2 Podwójny 400:27:10 1200
Rozmowa ogólna 8 kHz Głośniki 2 Podwójny 47:48:40 224
Dane medialne 16 kHz Wiele głośników Mono 227:57:43 438
Scenariusz Monolog 48 kHz Pojedynczy głośnik Mono 2,866:00:00 3,988
Scenariusz Monolog 24 kHz Pojedynczy głośnik Mono 29,000:00:00 Na Życzenie

Wyróżnieni klienci

Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.

Amazon
Google
Microsoft
Skontaktuj się z nami

Nie możesz znaleźć tego, czego szukasz?

Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych

Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy

  • To pole jest dla celów walidacji i powinny być pozostawione bez zmian.
  • Rejestrując się, zgadzam się z Shaip Polityka Prywatności oraz Regulamin i wyrazić zgodę na otrzymywanie komunikacji marketingowej B2B od Shaip.