Zestaw danych hebrajskich
ערכת נתונים עברית
Wysokiej jakości zbiór danych do ogólnych rozmów i podcastów w języku hebrajskim dla modeli AI i mowy
Przegląd
Tytuł (język)
Zestaw danych języka hebrajskiego
Typy zbiorów danych
Rozmowa ogólna, dane medialne
Kraj
Izrael
OPIS
Dostępne są nieskryptowane rozmowy telefoniczne między dwojgiem ludzi z Izraela w języku hebrajskim o długości od 15 do 60 minut, a także licencjonowane pliki audio lub wideo należące do domeny publicznej, takie jak wywiady i podcasty z udziałem od 1 do 5 uczestników, również o długości od 15 do 60 minut.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
| Typ zbioru danych | Częstotliwość próbkowania | Głośniki | Kanał | Suma godzin | Całkowita liczba głośników |
|---|---|---|---|---|---|
| Rozmowa ogólna | 8 kHz | Głośniki 2 | Podwójny | 398:47:10 | 814 |
| Dane medialne | 16 kHz | Wiele głośników | Mono | 426:14:16 | 885 |
Wyróżnieni klienci
Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.
Nie możesz znaleźć tego, czego szukasz?
Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych
Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy
Przegląd
Tytuł
hebrajski Zbiór danych języka
Typ zbioru danych
Rozmowa ogólna
OPIS
Nieskryptowana rozmowa telefoniczna między dwojgiem ludzi. Około. Czas trwania dźwięku (zakres) – 15-60 minut, hebrajski w Izraelu.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
Suma godzin
399
Próbna stawka
8 kHz
Kanał audio
Podwójny
Platforma nagrywania
Stacjonarny
Audio Format
. Wav
Format transkrypcji
.json
WER (%)
5
Demografia zbioru danych
Kraj
Izrael
Wybierz język
hebrajski
Płeć
Kobieta 414, Mężczyzna 399, Nieznane 1
Ilość głośników
814
Wiek
18-50
Przegląd
Tytuł
hebrajski Zbiór danych języka
Typ zbioru danych
Podcast
OPIS
Licencjonowane pliki audio/wideo należące do domeny publicznej, takie jak wywiady, podcasty itp. — od 1 do 5 osób. Około. Czas trwania dźwięku (zakres) 15-60 minut.
Przypadek użycia
ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka
Szczegóły zestawu danych
Suma godzin
427
Próbna stawka
16 kHz
Kanał audio
Mono
Platforma nagrywania
Pozyskiwanie sieciowe
Audio Format
. Wav
Format transkrypcji
.json
WER (%)
5
Demografia zbioru danych
Kraj
Izrael
Wybierz język
hebrajski
Płeć
Kobieta 361, Mężczyzna 513, Nieznane 13
Ilość głośników
887
Wiek
18-50