Набір даних арабської, тайської, в'єтнамської, хінді, англійської та китайської мов

Набір даних арабської, тайської, в'єтнамської, хінді, англійської та китайської мов

Корпус: OCR

Формат: зображення

Рахувати: 150k

Анотація: Так

X

Опис: Набір даних арабської, тайської, в'єтнамської, хінді, англійської та китайської мов

Набір арабських текстів

Набір арабських текстів

Корпус: OCR

Формат: зображення

Рахувати: 1k

Анотація: Так

X

Опис: Набір арабських текстових даних містить колекцію зразків тексту, написаних арабською мовою. Він включає різні форми вмісту, як-от новинні статті, публікації в соціальних мережах, літературу та діалоги, що охоплюють різні теми та стилі написання. Цей набір даних використовується для таких завдань, як обробка природної мови (NLP), класифікація тексту, аналіз настроїв і машинний переклад у програмах арабською мовою.

Набір даних китайської, англійської, тибетської та уйгурської мов

Набір даних китайської, англійської, тибетської та уйгурської мов

Корпус: OCR

Формат: зображення

Рахувати: 38k

Анотація: Так

X

Опис: Набір даних китайської, англійської, тибетської та уйгурської мов

Набір даних меню китайською та англійською мовами

Набір даних меню китайською та англійською мовами

Корпус: OCR

Формат: зображення

Рахувати: 60k

Анотація: Так

X

Опис: Набір даних меню китайською та англійською мовами містить зображення або текстові зразки меню ресторанів, які містять китайську та англійську мови. Він містить різноманітні шрифти, макети та структури меню, двомовні назви страв, описи та ціни. Цей набір даних корисний для таких завдань, як оптичне розпізнавання символів (OCR), машинний переклад і оцифрування меню в багатомовних налаштуваннях.

Китайський рукописний набір даних

Китайський рукописний набір даних

Корпус: OCR

Формат: зображення

Рахувати: 3k

Анотація: Так

X

Опис: Набір даних китайської рукописної композиції містить зразки рукописного тексту китайською мовою, включаючи твори, есе та інший довгий текст. Він містить різні стилі рукописного тексту та рівні складності та використовується для таких завдань, як розпізнавання рукописного тексту, аналіз тексту та навчання моделі машинного навчання.

Китайський набір запитів WIFI

Китайський набір запитів WIFI

Корпус: OCR

Формат: зображення

Рахувати: 1k

Анотація: Так

X

Опис: Китайський набір підказок WIFI складається із зразків тексту в підказках WIFI та на екранах входу, написаних китайською мовою. Зазвичай він містить різні підказки, інструкції та повідомлення про помилки, пов’язані з підключенням до мереж WIFI або керуванням ними. Цей набір даних використовується для таких завдань, як розпізнавання тексту, обробка природної мови та покращення інтерфейсів користувача для підключення до мережі.

Набір даних рукописного введення англійською та китайською мовами

Набір даних рукописного введення англійською та китайською мовами

Корпус: OCR

Формат: зображення

Рахувати: 12k

Анотація: Так

X

Опис: Набір даних рукописного введення англійською та китайською мовами містить зразки рукописного тексту англійською та китайською мовами, які демонструють різні стилі письма та складність символів. Зазвичай він використовується для навчання та оцінювання моделей розпізнавання рукописного тексту, підтримки аналізу багатомовного тексту та інших пов’язаних досліджень. Набір даних містить різноманітні символи, цифри, слова та речення обома мовами.

Набір даних Shopsign англійською та китайською мовами

Набір даних Shopsign англійською та китайською мовами

Корпус: OCR

Формат: зображення

Рахувати: 30k

Анотація: Так

X

Опис: Набір даних Shopsign англійською та китайською мовами містить зображення вивісок магазинів, які містять текст англійською та китайською мовами. Він фіксує різні елементи вивіски, такі як назви магазинів, рекламні оголошення, акції та маршрути, які відображаються різними шрифтами, стилями та форматами. Цей набір даних використовується для таких завдань, як виявлення та розпізнавання тексту, багатомовне розуміння сцени та вдосконалення моделей комп’ютерного зору для інтерпретації двомовних вивісок.

Англійська та китайська спеціальні кутові текстові дані

Англійська та китайська спеціальні кутові текстові дані

Корпус: OCR

Формат: зображення

Рахувати: 50k

Анотація: Так

X

Опис: Набір текстових даних під спеціальним кутом англійської та китайської мови містить зображення тексту, що відображається під різними кутами й орієнтаціями англійською та китайською мовами. Він містить текст із таких джерел, як вивіски, реклама та документи, які не представлені в стандартних горизонтальних форматах. Цей набір даних використовується для навчання та оцінки моделей виявлення та розпізнавання тексту, особливо тих, які здатні обробляти текст у нетрадиційних орієнтаціях і перспективах.

Набір даних англійського меню

Набір даних англійського меню

Корпус: OCR

Формат: зображення

Рахувати: 20k

Анотація: Так

X

Опис: Набір даних англійського меню містить зображення або зразки тексту меню ресторану, написані англійською мовою. Він містить різноманітні шрифти, макети та стилі форматування, а вміст варіюється від назв страв до описів і цін. Цей набір даних часто використовується для таких завдань, як оптичне розпізнавання символів (OCR), вилучення тексту та оцифрування меню в програмах, пов’язаних із їжею.

Текстовий набір англійських сцен

Текстовий набір англійських сцен

Корпус: OCR

Формат: зображення

Рахувати: 33k

Анотація: Так

X

Опис: Текстовий набір англійських сцен складається із зображень, що містять природні сцени з вбудованим англійським текстом. Текст відображається в різних формах, таких як вивіски, рекламні щити та плакати, часто в різних шрифтах, розмірах і орієнтаціях. Цей набір даних зазвичай використовується для навчання та тестування моделей у задачах виявлення, розпізнавання та розуміння сцени.

Набір даних рукописного тексту

Набір даних рукописного тексту

Корпус: Документ AI

Формат: HEIC (зображення) і .mov (відео)

Рахувати: 94053

Анотація: Немає

X

Опис: Живі фотографії з рукописним текстом для японської, корейської та російської

Записуючий пристрій: Камера iPhone і iPad

Умови запису: - Агресивне освітлення/відблиски - Спалах камери ввімкнено - Кольорове світло - Низьке освітлення, без спалаху камери - Нормальний

Набір даних японської та корейської мов

Набір даних японської та корейської мов

Корпус: OCR

Формат: зображення

Рахувати: 40k

Анотація: Так

X

Опис: Набір даних японської та корейської мов містить зразки тексту японською та корейською мовами. Він містить різноманітний вміст, наприклад речення, фрази та слова, що охоплює різні контексти та стилі. Цей набір даних використовується для таких завдань, як обробка природної мови (NLP), машинний переклад і аналіз тексту в багатомовних програмах.

Друкований звичайний/курсивний набір даних (документ AI)

Друкований звичайний/курсивний набір даних (документ AI)

Корпус: Документ AI

Формат: HEIC (зображення) і .mov (відео)

Рахувати: 23930

Анотація: Немає

X

Опис: Живі фотографії з рукописним текстом для японської, корейської та російської

Записуючий пристрій: Камера iPhone і iPad

Умови запису: - Агресивне освітлення/відблиски - Спалах камери ввімкнено - Кольорове світло - Низьке освітлення, без спалаху камери - Нормальний

Текст + Аудіо-візуальний контент (багатомовний/OCR/NLP) – книги, журнали, аудіо + текст

Текст + Аудіо-візуальний контент (багатомовний/OCR/NLP) – книги, журнали, аудіо + текст

Корпус: Текст + Аудіо-візуальне (багатомовний / OCR / NLP)

Формат: Відео

Рахувати: 100 тис.+ відеолекцій + відео PPT довгого формату

Анотація: Немає

X

Опис: Китайські книги, англійські книги, журнали, державна політика, романи, діти, кантонська аудіо+текст, відеолекції+PPT, відео довгого формату. Півмільярда книг, пар питань і відповідей, статей.