Ключ до подолання перешкод у розвитку ШІ

Більш надійні дані

Вступ

Штучний інтелект почав захоплювати уяву, коли олов'яна людина з «Чарівника країни Оз» вийшла на екрани в 1939 році, і з тих пір він лише міцніше закріпився в духу часу. Однак у застосуванні продукти штучного інтелекту пройшли через регулярні цикли підйому та спаду, які досі зупиняли найвпливовіші впровадження.

Під час буму інженери та дослідники досягли величезних успіхів, але коли їхні прагнення неминуче випереджають обчислювальні можливості, доступні на той час, настав період спокою. На щастя, експоненціальне збільшення обчислювальної потужності, передбачене законом Мура в 1965 році, здебільшого виявилося точним, і значення цього збільшення важко переоцінити.

Перешкоди розвитку штучного інтелекту
Прочитайте електронну книгу: ключ до подолання перешкод розвитку AI, або завантажити PDF-версію електронної книги.

Ключ до подолання перешкод у розвитку ШІ: більш надійні дані

Сьогодні середня людина має в кишені в мільйони разів більше обчислювальної потужності, ніж NASA, щоб здійснити висадку на Місяць у 1969 році. Той самий повсюдний пристрій, який зручно демонструє велику кількість обчислювальної потужності, також відповідає ще одній передумові для золотого віку ШІ: велика кількість даних. За даними дослідницької групи інформаційного перевантаження, 90% світових даних було створено за останні два роки. Тепер, коли експоненційний ріст обчислювальної потужності нарешті збігся з таким же швидкісним зростанням у генерації даних, інновації в області даних AI вибухають настільки, що деякі експерти думають, що прискорять Четверту промислову революцію.

Дані Національної асоціації венчурного капіталу вказують на те, що в першому кварталі 6.9 року в сектор штучного інтелекту були інвестиції в рекордні 2020 мільярдів доларів. Неважко побачити потенціал інструментів штучного інтелекту, оскільки він уже використовується повсюдно. Деякі з найбільш помітних випадків використання продуктів AI — це механізми рекомендацій, які стоять за нашими улюбленими програмами, такими як Spotify та Netflix. Хоча цікаво знайти нового виконавця для прослуховування або нове телешоу для перегляду, ці реалізації є досить низькими. Інші алгоритми оцінюють результати тестів — частково визначають, куди приймають студентів до коледжу — а ще інші перебирають резюме кандидатів, вирішуючи, хто з претендентів отримає конкретну роботу. Деякі інструменти штучного інтелекту можуть навіть мати наслідки для життя або смерті, наприклад, модель AI, яка виявляє рак молочної залози (що перевершує лікарів).

Незважаючи на постійне зростання як реальних прикладів розвитку ШІ, так і кількості стартапів, які змагаються за створення нового покоління трансформаційних інструментів, проблеми для ефективної розробки та впровадження залишаються. Зокрема, вихід AI точний лише настільки, наскільки це дозволяє введення, а це означає, що якість має першорядне значення.

Перешкоди розвитку штучного інтелекту

Проблема непостійної якості даних у рішеннях AI

За даними Social Media Today, справді щодня генерується неймовірна кількість даних: 2.5 квінтильйони байт. Але це не означає, що все це заслуговує на тренування вашого алгоритму. Деякі дані є неповними, деякі низької якості, а деякі просто неточними, тому використання будь-якої з цієї помилкової інформації призведе до тих самих особливостей ваших (дорогих) інноваційних даних AI. Згідно з дослідженням Gartner, близько 85% проектів штучного інтелекту, створених до 2022 року, будуть давати неточні результати через упереджені або неточні дані. Хоча ви можете легко пропустити рекомендацію пісні, яка не відповідає вашим смакам, інші неточні алгоритми мають значні фінансові та репутаційні витрати.

У 2018 році Amazon почала використовувати інструмент найму на основі штучного інтелекту, який виробляється з 2014 року, який мав сильне та безпомилкове упередження щодо жінок. Виявилося, що комп’ютерні моделі, що лежать в основі інструменту, навчалися за допомогою резюме, поданих у компанію протягом десяти років. Оскільки більшість технічних претендентів були чоловіками (і досі є, можливо, завдяки цій технології), алгоритм вирішив штрафувати резюме, включаючи «жіночі» будь-де — наприклад, капітана жіночого футболу чи жіночої бізнес-групи. Вирішили навіть покарати абітурієнтів двох жіночих коледжів. Amazon стверджує, що інструмент ніколи не використовувався як єдиний критерій для оцінки потенційних кандидатів, але рекрутери звертали увагу на механізм рекомендацій при пошуку нових працівників.

Інструмент найму Amazon був остаточно скасований після багатьох років роботи, але урок затягується, підкреслюючи важливість якості даних під час навчання алгоритмів та інструментів штучного інтелекту. Як виглядають «якісні» дані? Коротше кажучи, він встановлює ці п’ять прапорців:

1. Відповідні

Щоб дані вважалися високоякісними, вони повинні вносити щось цінне в процес прийняття рішень. Чи існує кореляція між статусом претендента на роботу як чемпіона штату зі стрибків з жердиною та його продуктивністю на роботі? Це можливо, але здається дуже малоймовірним. Відсіюючи нерелевантні дані, алгоритм може зосередитися на сортуванні інформації, яка насправді впливає на результати.

2. Точний

Ці дані, які ви використовуєте, повинні точно відображати ідеї, які ви тестуєте. Якщо ні, то воно того не варте. Наприклад, Amazon навчив свій алгоритм найму, використовуючи 10-річні резюме кандидатів, але незрозуміло, чи компанія першою підтвердила інформацію, надану в цих резюме. Дослідження компанії Checkster, що перевіряє рекомендації, показує, що 78% претендентів брешуть або планують збрехати в заяві про роботу. Наприклад, якщо алгоритм приймає рекомендаційні рішення, використовуючи GPA кандидата, було б добре спочатку підтвердити справжність цих чисел. Цей процес займе час і гроші, але він також безсумнівно підвищить точність ваших результатів.

3. Правильно організований та анотований

У випадку моделі найму, заснованої на резюме, анотація відносно проста. У певному сенсі, резюме приходить з попередніми анотаціями, хоча, безсумнівно, будуть винятки. Більшість претендентів вказують свій досвід роботи в заголовку «Досвід», а відповідні навички — у розділі «Навички». Однак в інших ситуаціях, таких як скринінг на рак, дані будуть набагато різноманітнішими. Інформація може надходити у вигляді медичних зображень, результатів фізичного скринінгу або навіть розмови між лікарем і пацієнтом про сімейний анамнез здоров’я та випадки раку, серед інших форм даних. Щоб ця інформація сприяла точному алгоритму виявлення, вона повинна бути ретельно організована та анотована, щоб модель AI навчилася робити точні прогнози на основі правильних висновків.

4. Актуальний

Amazon намагалася створити інструмент, який би заощадив час і гроші, відтворюючи ті самі рішення щодо найму, які люди приймають за набагато менший час. Щоб зробити рекомендації максимально точними, дані необхідно оновлювати. Наприклад, якби компанія колись продемонструвала перевагу кандидатам, які вміють ремонтувати друкарські машинки, ці історичні наймані, ймовірно, не мали б особливого впливу на придатність сучасних претендентів на будь-яку посаду. В результаті було б розумно їх видалити.

5. Доречно різноманітний

Інженери Amazon вирішили навчати алгоритм із групою кандидатів, переважно чоловіків. Це рішення було критичною помилкою, і його робить не менш кричущим той факт, що на той момент у компанії були такі резюме. Інженери Amazon могли б співпрацювати з шанованими організаціями з подібними наявні посади, які отримали більше жінок, які претендують на роботу, щоб заповнити недолік, або міг би штучно скоротити кількість резюме чоловіків, щоб відповідати кількості жінок і навчених і керувалися алгоритмом з більш точним представленням сукупності. Справа в тому, що дані різноманітність є ключовим фактором, і якщо не буде докладено узгоджених зусиль для усунення упередженості у входах, упереджені результати будуть переважають.

Очевидно, що високоякісні дані не з’являються нізвідки. Натомість його потрібно ретельно підготувати з урахуванням передбачуваних результатів. У сфері штучного інтелекту часто кажуть, що «сміття в – означає сміття поза». Це твердження вірне, але воно дещо применшує важливість якості. ШІ може обробляти неймовірну кількість інформації та перетворювати її на що завгодно, від вибору акцій до рекомендацій щодо найму до медичних діагнозів. Ця здатність набагато перевершує можливості людей, що також означає, що вона збільшує результати. Один упереджений рекрутер міг не помічати стільки жінок, але упереджений рекрутер із штучним інтелектом міг не помітити їх усіх. У цьому сенсі сміття не означає просто вивезення сміття — це означає, що невелика кількість «сміттєвих» даних може перетворитися на ціле сміттєзвалище.

Подолання перешкод розвитку ШІ

Зусилля з розробки AI включають значні перешкоди, незалежно від того, в якій галузі вони відбуваються, а процес переходу від здійсненної ідеї до успішного продукту є складним. Між труднощами отримання правильних даних і необхідністю анонімізації їх, щоб відповідати всім відповідним нормам, може здатися, що насправді побудувати та навчати алгоритм є легкою частиною.

Щоб надати вашій організації всі переваги, необхідні для розробки новаторської розробки штучного інтелекту, вам варто розглянути можливість партнерства з такою компанією, як Shaip. Четан Паріх і Ватсал Гія заснували Shaip, щоб допомогти компаніям розробляти рішення, які могли б змінити охорону здоров'я в США. Після більш ніж 16 років у бізнесі наша компанія зросла до більш ніж 600 членів команди, і ми працювали з сотнями клієнтів, щоб перетворити привабливі ідеї в рішення AI.

Завдяки нашим людям, процесам і платформі, які працюють для вашої організації, ви можете негайно розблокувати наступні чотири переваги та катапультувати свій проект до успішного завершення:

1. Здатність звільнити науковців даних

Можливість звільнити ваших науковців з даних
Процес розробки AI займає значні витрати часу, але ви завжди можете оптимізувати функції, на виконання яких ваша команда витрачає найбільше часу. Ви найняли своїх спеціалістів з обробки даних, оскільки вони є експертами в розробці передових алгоритмів і моделей машинного навчання, але дослідження постійно демонструє, що ці працівники насправді витрачають 80% свого часу на пошук, очищення та впорядкування даних, які забезпечать роботу проекту. Понад три чверті (76%) дослідників даних повідомляють, що ці повсякденні процеси збору даних також є найменш улюбленими частинами роботи, але потреба в якісних даних залишає лише 20% їхнього часу на фактичну розробку, тобто найцікавіша та інтелектуально стимулююча робота для багатьох дослідників даних. Здійснюючи пошук даних через стороннього постачальника, такого як Shaip, компанія може дозволити своїм дорогим і талановитим інженерам з обробки даних передати свою роботу в якості прибиральників даних і замість цього витрачати свій час на частини рішень AI, де вони можуть принести найбільшу цінність.

2. Здатність досягати кращих результатів

Здатність досягати кращих результатів Багато керівників розробників штучного інтелекту вирішують використовувати дані з відкритим кодом або краудсорсингові дані, щоб скоротити витрати, але це рішення майже завжди в кінцевому підсумку обходиться дорожче в довгостроковій перспективі. Ці типи даних легкодоступні, але вони не можуть зрівнятися з якістю ретельно підібраних наборів даних. Краудсорсингові дані, зокрема, рясніють помилками, упущеннями та неточностями, і хоча ці проблеми іноді можна вирішити під час процесу розробки під пильним оком ваших інженерів, потрібні додаткові ітерації, які не знадобилися б, якщо ви почали з вищої -якісні дані з самого початку.

Покладатися на дані з відкритим вихідним кодом є ще одним поширеним ярликом, який має власний набір підводних каменів. Відсутність диференціації є однією з найбільших проблем, оскільки алгоритм, навчений з використанням даних з відкритим вихідним кодом, легше тиражується, ніж алгоритм, побудований на ліцензованих наборах даних. Ідучи цим шляхом, ви заохочуєте конкуренцію з боку інших учасників у сфері, які можуть у будь-який момент знизити ваші ціни та зайняти частку ринку. Якщо ви покладаєтесь на Shaip, ви отримуєте доступ до даних найвищої якості, зібраних умілими керованими працівниками, і ми можемо надати вам ексклюзивну ліцензію на користувацький набір даних, який не дозволить конкурентам легко відтворити вашу інтелектуальну власність, здобуту важким трудом.

3. Доступ до досвідчених фахівців

Доступ до досвідчених професіоналів Навіть якщо у вашому штатному списку є кваліфіковані інженери та талановиті науковці з даних, ваші інструменти штучного інтелекту можуть отримати користь від мудрості, яка приходить лише через досвід. Наші експерти з цієї тематики очолювали численні впровадження штучного інтелекту у своїх галузях та отримали цінні уроки на цьому шляху, і їхня єдина мета — допомогти вам досягти свого.

Завдяки тому, що експерти з області ідентифікують, упорядковують, категоризують і позначають дані для вас, ви знаєте, що інформація, яка використовується для навчання вашого алгоритму, може дати найкращі результати. Ми також проводимо регулярну перевірку якості, щоб переконатися, що дані відповідають найвищим стандартам і будуть працювати належним чином не тільки в лабораторії, а й у реальній ситуації.

4. Прискорений термін розробки

Розробка AI не відбувається за одну ніч, але це може статися швидше, якщо ви співпрацюєте з Shaip. Внутрішній збір даних і анотація створює значне операційне вузьке місце, яке стримує решту процесу розробки. Робота з Shaip дає вам миттєвий доступ до нашої величезної бібліотеки готових до використання даних, а наші експерти зможуть отримати будь-які додаткові дані, які вам потрібні, завдяки нашим глибоким знанням галузі та глобальній мережі. Без тягаря пошуку джерел та анотацій ваша команда може негайно приступити до фактичної розробки, а наша навчальна модель може допомогти виявити ранні неточності, щоб зменшити кількість повторень, необхідних для досягнення цілей точності.

Якщо ви не готові передати всі аспекти управління даними на аутсорсинг, Shaip також пропонує хмарну платформу, яка допомагає командам ефективніше створювати, змінювати й анотувати різні типи даних, включаючи підтримку зображень, відео, тексту та аудіо. . ShaipCloud включає в себе ряд інтуїтивно зрозумілих інструментів перевірки та робочого процесу, таких як запатентоване рішення для відстеження та моніторингу робочих навантажень, інструмент транскрипції для транскрибування складних і складних аудіозаписів, а також компонент контролю якості для забезпечення безкомпромісної якості. Найкраще те, що він масштабований, тому він може зростати в міру зростання різноманітних вимог вашого проекту.

Епоха інновацій AI тільки починається, і в найближчі роки ми побачимо неймовірні досягнення та інновації, які можуть змінити цілі галузі або навіть змінити суспільство в цілому. У Shaip ми хочемо використовувати свій досвід, щоб служити трансформаторною силою, допомагаючи найбільш революційним компаніям у світі використовувати силу рішень AI для досягнення амбітних цілей.

Ми маємо глибокий досвід роботи з додатками для охорони здоров’я та розмовним штучним інтелектом, але ми також маємо необхідні навички, щоб тренувати моделі практично для будь-якого виду застосування. Щоб отримати додаткову інформацію про те, як Shaip може допомогти перенести ваш проект від ідеї до реалізації, перегляньте численні ресурси, доступні на нашому веб-сайті, або зв’яжіться з нами сьогодні.

Прискорений графік розробки

Давай поговоримо

  • Реєструючись, я погоджуюся з Шайпом Політика Конфіденційності та Умови обслуговування і надати мою згоду на отримання маркетингової інформації B2B від Shaip.
  • Це поле для цілей перевірки і повинні бути залишені без змін.