Teraz zdobądź 50% ZNIŻKI* w sprawie gotowych zestawów danych konwersacyjnej sztucznej inteligencji

Zbiór danych mowy i dźwięku dla chatbotów, asystentów głosowych, urządzeń obsługujących mowę.

*Oferta ograniczona czasowo

  • Rejestrując się, zgadzam się z Shaip Polityka prywatności i Regulamin i wyrazić zgodę na otrzymywanie komunikacji marketingowej B2B od Shaip.

Zaufany przez liderów branży

SzczegółyGotowy zestaw danych językowychRozmowy w call center 8 kHz*Rozmowy ogólne 8 kHz*Media i podcasty 16 kHz*Wypowiedź/ Monolog oparty na scenariuszu 16 kHz*Całkowita objętość w godzinachDialekty objęteAudio FormatFormat transkrypcji tekstuPrzypadek użyciaŹródłoCTA
PrzemówienieAfrikaansZbiór danych audio w języku afrikaans6009001500Język afrikaans używany w Afryce. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieArabowieArabski zbiór danych audio80015002300Arabski z krajów Zatoki Perskiej. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniechińskiChiński zbiór danych audio20002000Chińczyk z Chin. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieduńskiDuński zbiór danych audio40060020003000Duńczyk z Danii. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieholenderskiHolenderski zbiór danych audio20002000Holender z Holandii. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieAngielski — akcent AAVEAngielski — zbiór danych audio AAVE (African American Vernacular English).5005001000Odmiana wernakularna (czasami znana jako AAVE, zwykle używana przez zdecydowaną większość Afroamerykanów z klasy robotniczej i średniej) i bardziej standardowa odmiana (zwykle używana przez Afroamerykanów z klasy średniej w sytuacjach formalnych i publicznych), ale z silniejszy nacisk na języku narodowym.. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieAngielski — akcent bostoński/nowojorskiAngielski — zbiór danych dźwiękowych z Bostonu/Nowego Jorku225225350800Jest to zbiór kilku regionalnych akcentów używanych w okolicach Bostonu, Nowego Jorku i Filadelfii. Te akcenty mogą brzmieć podobnie do nie-miejscowych, ale różnią się od innych akcentów amerykańskich. Pomimo pewnego lokalnego słownictwa, które różni się od innych części anglojęzycznego świata, te akcenty są wzajemnie zrozumiałe z angielskim używanym w innych miejscach.. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieAngielski - chiński akcentAngielsko-chiński zestaw danych audio z akcentami150300450Osoby mówiące po chińsku jako pierwszym języku, które przeprowadziły się/wyemigrowały do ​​Stanów Zjednoczonych jako nastolatki/dorośli i nauczyły się angielskiego jako drugiego języka.. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieAngielski — akcent z głębokiego południaAngielski - Zbiór danych audio Deep South2752754501000Prelegenci z (i) Teksasu; (ii) Karolina Północna, Karolina Południowa, Georgia; (iii) Nowy Orlean; (iv) Floryda Zachodnia; (v) Tennessee, Arkansas, Michigan.. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
Przemówienieangielski - akcent latynoskiZestaw danych dźwiękowych z akcentem hiszpańskim w języku angielskim400400800Hiszpański angielski odnosi się do odmian amerykańskiego angielskiego używanego przez latynoskich Amerykanów o zróżnicowanym pochodzeniu narodowym. Skupiono się głównie na meksykańskich Amerykanach, mówiących o różnym pochodzeniu narodowym (np. Meksyk, Portoryko, Dominikana, Ekwador, Kuba itp.) oraz z różnych regionów (np. Kalifornia, Nowy Jork, Floryda). Uwzględniono mówców, którzy mówią po hiszpańsku jako pierwszym języku, a także osoby pochodzenia latynoskiego, które mówią po hiszpańsku jako ojczystym języku.. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieAngielski z akcentem nowozelandzkimAngielski — nowozelandzki zbiór danych dźwiękowych2507501000Mówcy na obu wyspach, w tym mieszanka młodszych mówców (<40 lat) i starszych mówców (>40 lat) w równych proporcjach.. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieAngielski — akcent singapurskiAngielski — zbiór danych dźwiękowych w Singapurze4006001000Zarówno standardowy singapurski angielski, jak i potoczny singapurski angielski. Singapurczycy o różnym pochodzeniu etnicznym (np. Chińczycy, Malajowie, Hindusi itp.) io różnym poziomie wykształcenia.. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieAngielski - akcent z RPAAngielski — zbiór danych audio w RPA4006001000Przedstawiciele różnych klas społeczno-ekonomicznych i środowisk etnologicznych (np. mieszkańcy RPA pochodzenia europejskiego, afrykańskiego, indyjskiego lub mieszanego).. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieAngielski - irlandzki akcentAngielsko-irlandzki zbiór danych audio500500Angielski używany w Irlandii. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieAngielski - szkocki akcentAngielsko-szkocki zbiór danych audio800800Angielski używany przez Szkotów. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieAngielski - walijski akcentAngielsko-walijski zbiór danych audio800800walijski angielski. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieFrancuski kanadyjskiFrancuski kanadyjski zbiór danych audio10001000Kanadyjski francuski. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniehebrajskiHebrajski zbiór danych audio7507501500Hebrajski w Izraelu. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieindonezyjskiIndonezyjski zbiór danych audio100010002000Bahasa indonezyjski. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieJaponkiJapoński zbiór danych audio20002000Japończyk z Japonii. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniekoreańskiKoreański zbiór danych audio10020015001800Mówcy rozprzestrzenili się po całej Korei Południowej.. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniemalajskiMalajski zbiór danych audio5005001000Malajski w Malezji. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieMeksykański hiszpańskiZestaw danych audio w języku meksykańskim i hiszpańskim12501250Meksykanin z Meksyku. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniePolskiPolski zbiór danych audio25020002250Polak z Polski. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieRosyjskiRosyjski zestaw danych audio20002000Rosjanin z Rosji. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniesuahiliZbiór danych audio w języku suahili3506501000południowoafrykański i kenijski suahili. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieszwedzkiSzwedzki zbiór danych audio3506501000Szwedzki w Szwecji. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieTajwan chińskiTajwański zestaw danych audio w języku chińskim10001000Chińczyk z Tajwanu. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienietajskiTajski zbiór danych audio350450800Nieformalny rejestr używany między przyjaciółmi,. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienietureckiTurecki zbiór danych audio20002000Turek z Turcji. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniewietnamskiWietnamski zbiór danych audio6004001000Północna (np. Hanoi), środkowa i południowa (np. Ho Chi Minh).. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniehinduskiZestaw danych audio w języku hindi80020002800Hindi w Indiach, szczególnie w regionach północnych, wschodnich i zachodnich. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieHinglijskiZestaw danych audio w języku indyjskim i angielskim300500800Zebrane z indyjskich miast miejskich, które są centrami finansowymi kraju ze względu na rosnące możliwości gospodarcze. Takimi miejscami mogą być Noida, Delhi, Dehradun, Chandigarh, Bombaj, Kalkuta, Bangalore, Pune, Chennai, Hyderabad itp.. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieAngielskiAngielski zbiór danych audio700700. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniekannadaZbiór danych audio w języku kannada6010040200Kannada z Karnataki w Indiach. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniemalajalamZbiór danych audio w języku malajalam6010040200Malajalam z Kerali, Lakshadweep i Puducherry. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieOriyaZbiór danych audio Oriya6010040200Oriya z części Odisha, Bengalu Zachodniego, Jharkhand i Chhattisgarh. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniePunjabiZbiór danych audio w języku pendżabskim6010040200Pendżabski z Pendżabu w Indiach. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieTamilTamilski zbiór danych audio60100240400Tamil z Tamil Nadu w Indiach. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieteluguZestaw danych audio w języku telugu1009509502000Telugu z Andhra Pradesh w Indiach. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniebengalskiZbiór danych audio w języku bengalskim6010040200Bengalski z Bengalu Zachodniego w Indiach. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniegujaratiZbiór danych audio gudżarati6010040200Gudżarati z Gudżaratu w Indiach. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówieniemarathiZbiór danych audio marathi6010040200Marathi z Maharasztry w Indiach. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip
PrzemówienieAsamskiAsamski zbiór danych audio6010040200Assamczycy z Assam w Indiach. Wav.jsonASR, wirtualny asystent, chatbot, konwersacyjna sztuczna inteligencja, analiza mowy, TTS, modelowanie językaSzaip

Głęboka wiedza na temat konwersacyjnej sztucznej inteligencji

Konwersacyjna sztuczna inteligencja, chatboty lub wirtualni/cyfrowi asystenci są tak inteligentni, jak technologia i dane, które za nimi stoją. W Shaip oferujemy szeroki zestaw zróżnicowanych zestawów danych dźwiękowych do przetwarzania języka naturalnego (NLP), które naśladują rozmowy z prawdziwymi ludźmi, co pozwala ożywić sztuczną inteligencję. Dzięki naszemu głębokiemu zrozumieniu pomagamy Ci tworzyć i lokalizować modele mowy obsługujące sztuczną inteligencję z najwyższą precyzją dzięki bogatym i ustrukturyzowanym zestawom danych w wielu językach z całego świata. Oferujemy wielojęzyczne usługi gromadzenia dźwięku, transkrypcji dźwięku i adnotacji dźwiękowych w oparciu o Twoje wymagania, jednocześnie w pełni dostosowując pożądaną intencję, wypowiedzi i rozkład demograficzny.

Kolekcja mowy skryptowej

Spontaniczna kolekcja mowy

Transkrypcja danych audio

Etykietowanie danych i adnotacje

Shaip pozwala dokładnie szkolić platformę Conversational AI Platform, aby mogła:

  • Bezproblemowo rozmawiaj, wysyłaj SMS-y i czatuj na wielu kanałach.
  • Ucz się na podstawie istniejących interakcji w formie czatu, zapisów głosowych, transakcji itp. oraz sugeruj i rozmawiaj w oparciu o te wnioski.
  • Zrozum intencje stojące za ludzką mową i usuń dwuznaczność w rozumieniu ludzkiego języka.
  • Kontaktuj się z Tobą na zasadzie jeden na jednego i możesz zostać przeszkolony w zakresie identyfikowania użytkowników i zapamiętywania przeszłych rozmów.

Światowy lider w zakresie konwersacyjnych danych szkoleniowych AI

Godziny danych dźwiękowych w ponad 100 językach – pozyskiwane, transkrybowane i opatrzone adnotacjami

Licencjonowanie danych mowy​

Ponad 20 40 godzin danych mowy w ponad 55 językach i dialektach obejmujących ponad XNUMX tematów z różnych dziedzin, np. Call-center, debaty, rozmowy ogólne, przemówienia, podcasty itp.

Zbieranie danych mowy

Zbieraj dane audio i mowy (monolog, rozmowa 2-osobowa, czat człowiek-bot) w ponad 100 językach z całego świata, dostosowanych do Twoich wymagań AI.

Transkrypcja danych mowy

Ekonomiczna transkrypcja audio lub adnotacja audio dzięki sile 30,000 współpracowników z gwarantowanym TAT, dokładnością i oszczędnościami

Przyspiesz tworzenie aplikacji AI do konwersacji dzięki usługom kolekcji audio i adnotacji audio

Przewaga Shaip

Skala​

Możemy pozyskiwać, skalować i dostarczać dane audio z całego świata w wielu językach i dialektach w oparciu o Twoje wymagania.

Ekspertyza

Posiadamy odpowiednią wiedzę fachową w zakresie dokładnego i bezstronnego gromadzenia danych, transkrypcji i adnotacji o złotym standardzie. .

Sieć

Sieć ponad 30,000 wykwalifikowanych współpracowników, którym można szybko przydzielić zadania związane z gromadzeniem danych, aby zbudować model szkolenia AI i usługi skalowania.

Technologia

Dysponujemy platformą w pełni opartą na sztucznej inteligencji z zastrzeżonymi narzędziami i procesami, które umożliwiają zarządzanie przepływem pracy 24*7 przez całą dobę.

Zwinność

Bardzo szybko dostosowujemy się do zmian wymagań klientów i pomagamy w przyspieszeniu rozwoju AI dzięki wysokiej jakości danych głosowych 5-10x szybciej niż konkurencja.

Bezpieczeństwo

Przywiązujemy najwyższą wagę do bezpieczeństwa danych i prywatności, a także posiadamy certyfikaty do przetwarzania danych wrażliwych podlegających ściśle określonym regulacjom. .

Co robimy najlepiej

Dane treningowe

Uzyskaj znakowane dane najwyższej jakości w ułamku czasu. Jest złotym standardem, niezawodny i gotowy do trenowania modeli AI i ML, aby osiągnąć najwyższy poziom wydajności.

Więcej szczegółów

Zbieranie danych, etykietowanie i adnotacje

Dzięki Shaip zyskujesz ponad 15 lat sprawdzonego doświadczenia w zbieraniu, transkrypcji i komentowaniu danych wysokiej jakości. Dzięki naszej globalnej sile roboczej możemy zbierać dane z całego świata, a następnie świadczyć usługi etykietowania i adnotacji z doskonałym poziomem umiejętności i wiedzy wymaganej dla Twoich danych.

Więcej szczegółów

Katalogi danych i licencjonowanie

Dzięki naszemu obszernemu spisowi milionów zestawów danych możesz zbierać i organizować zgodnie z wymaganiami. Następnie możemy licencjonować te dane jakościowe dla określonych wymagań dotyczących korzystania z AI i ML. Co więcej, te dane są dostępne za ułamek kosztów, jeśli tworzysz je samodzielnie.

Więcej szczegółów

Chcesz zbudować własny zestaw danych?

Skontaktuj się z nami teraz, aby dowiedzieć się, jak możemy zebrać niestandardowy zestaw danych dla Twojego unikalnego rozwiązania AI.