Zbiór danych w języku angielskim w Nowym Jorku

Wysokiej jakości nowojorski zestaw danych Call-Center, General Conversation i Podcast dla modeli AI i mowy

Zakładka Podgląd

Tytuł

Zestaw danych języka angielskiego w Nowym Jorku

Typ zbioru danych

Centrum telefoniczne

Opis

Nieskryptowana, syntetyczna rozmowa telefoniczna między „agentem” a „klientem”, ok. Czas trwania dźwięku (zakres) 5-15 minut.

Przypadek użycia

ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka

Szczegóły zestawu danych

Suma godzin

103

Próbna stawka

8 kHz

Kanał audio

Mono

Platforma nagrywania

Stacjonarny

Audio Format

. Wav

Format transkrypcji

.json

WER (%)

5

Demografia zbioru danych

Państwo

USA

Wybierz język

Nowy Jork angielski

Płeć

Kobieta 610, Mężczyzna 532, Nieznane 0

Ilość głośników

1,142

Wiek

18-50

Zakładka Podgląd

Tytuł

Zestaw danych języka angielskiego w Nowym Jorku

Typ zbioru danych

Rozmowa ogólna

Opis

Nieskryptowana rozmowa telefoniczna między dwojgiem ludzi. Około. Czas trwania dźwięku (zakres) – 15-60 minut.

Przypadek użycia

ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka

Szczegóły zestawu danych

Suma godzin

107

Próbna stawka

8 kHz

Kanał audio

Podwójny

Platforma nagrywania

Stacjonarny

Audio Format

. Wav

Format transkrypcji

.json

WER (%)

5

Demografia zbioru danych

Państwo

USA

Wybierz język

Nowy Jork angielski

Płeć

Kobieta 118 Mężczyzna 114 Nieznany 0

Ilość głośników

232

Wiek

18-50

Zakładka Podgląd

Tytuł

Zestaw danych języka angielskiego w Nowym Jorku

Typ zbioru danych

TTS

Opis

Licencjonowane pliki audio/wideo należące do domeny publicznej, takie jak wywiady, podcasty itp. — od 1 do 5 osób. Około. Czas trwania dźwięku (zakres) 15-60 minut.

Przypadek użycia

ASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie języka

Szczegóły zestawu danych

Suma godzin

140

Próbna stawka

16 kHz

Kanał audio

Mono

Platforma nagrywania

Pozyskiwanie sieciowe

Audio Format

. Wav

Format transkrypcji

.json

WER (%)

5

Demografia zbioru danych

Państwo

USA

Wybierz język

Nowy Jork angielski

Płeć

Kobieta 66, Mężczyzna 230, Nieznane 11

Ilość głośników

307

Wiek

18-50

Wyróżnieni klienci

Umożliwianie zespołom tworzenia wiodących na świecie produktów AI.

Amazonka
Google
Microsoft
Skontaktuj się z nami

Nie możesz znaleźć tego, czego szukasz?

Nowe, gotowe zestawy danych są gromadzone we wszystkich typach danych

Skontaktuj się z nami teraz, aby uwolnić się od obaw związanych z gromadzeniem danych dotyczących treningu audio/mowy

  • Rejestrując się, zgadzam się z Shaip Polityce prywatności i Regulamin i wyrazić zgodę na otrzymywanie komunikacji marketingowej B2B od Shaip.
  • To pole jest dla celów walidacji i powinny być pozostawione bez zmian.