china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网

公眾號
關注微信公眾號
移動端
創頭條企服版APP

制定機器學習訓練數據策略的6個技巧

5304
網絡大數據 2019-09-11 07:52 搶發第一評
AI系統通過實例來學習,它們擁有的高質量實例數據越多,就會學得越好。缺乏,或只有低質量的訓練數據可能會生成不可靠的系統,得出錯誤的結論,做出糟糕的決策,無法處理現實世界的變化,并引入或延續一些如偏見等問題。

人工智能(AI)和機器學習(ML)如今已經十分常見。AI指的是機器模仿人類進行認知的概念,ML是一種用于構建AI的方法。如果AI是指計算機可以根據指令執行一組任務,那么ML就是機器從數據中攝取、解析和學習的能力,以便更精確地完成任務。

汽車、金融、政府、醫療、零售和科技等行業的大部分管理者都已經對ML和AI有了基本的了解。不過,并非每個人都是一個制定訓練數據策略的專家——而這往往是實現ML高投資回報的必要的第一步。

AI系統通過實例來學習,它們擁有的高質量實例數據越多,就會學得越好。缺乏,或只有低質量的訓練數據可能會生成不可靠的系統,得出錯誤的結論,做出糟糕的決策,無法處理現實世界的變化,并引入或延續一些如偏見等問題。

如果沒有一個良好定義的策略來收集和組織你需要訓練、測試和優化AI系統的數據,你將面臨項目延遲、無法適當擴展以及被競爭對手超過的風險。下面是構建一個成功的訓練數據策略的6個技巧。

?

?

Pexels 上的 Pixabay 拍攝的照片

1、制定訓練數據預算

當啟動一個新的ML項目時,首先要定義的是要實現的目標。這會讓你知道,你的系統中需要哪種類型的數據,以及需要多少“訓練項”(已分類的數據點)。

例如,計算機視覺或圖像識別項目的訓練項目,使用人工注釋標記的圖像數據,用于識別圖像的內容(樹、停車標志、人、車等)。此外,根據你正在構建的解決方案的類型,你的模型可能需要不斷地重新培訓或刷新。你的解決方案可能需要每季度、每月甚至每周進行更新。

一旦確定了訓練項目和更新頻率,你就可以評估關于采購數據的一些選項,并計算預算。

重要的是要清楚地了解啟動該計劃所需的時間和資金成本,隨著時間的推移對其進行維護,并隨著業務的發展對特性和功能進行改進,從而使解決方案對你的客戶保持相關性和價值性。啟動ML計劃是一項長期投資。獲得高回報需要一個長期的策略。

2、收集適當的數據

你需要的數據類型取決于你正在構建的解決方案的類型。一些數據來源包括實際使用數據、調查數據、公共數據集和合成數據。例如,一個能夠理解人類語音命令的語音識別解決方案必須針對已翻譯成文本的高質量語音數據(實際數據)進行培訓。搜索解決方案需要由人工注釋的文本數據來告訴它哪些結果是最相關的。

ML中最常用的數據類型是圖像、視頻、語音、音頻和文本。在用于ML之前,必須對訓練數據進行注釋或標記,以確定它們是什么。注釋可以告訴模型如何處理每段數據。例如,如果一個虛擬助理的一條訓練數據是某個人的錄音“多訂購一點AA電池”,注釋可能會告訴系統在聽到“訂購”時,與某個在線零售商處下個訂單,在聽到“AA電池”時搜索“AA電池”。

3、保證數據質量

根據任務的不同,數據注釋可能是一項相對簡單的活動,但是它也是重復的、耗時的,并且很難始終正確地執行。它需要人的介入。

數據質量帶來的風險很高,因為如果你根據不準確的數據訓練模型,那么模型將會做錯誤的事情。例如,如果你訓練一個自動駕駛汽車的計算機視覺系統,將人行道的圖像錯誤地標記為街道,結果可能是災難性的。事實上,糟糕的數據質量,是阻止ML廣泛且有效使用的頭號敵人。

當我們討論數據質量時,我們談論的是標簽的準確性和一致性。準確是一個標簽距離事實有多近;一致性是不同訓練項目上的多個注釋彼此一致的程度。

4 .注意并減少數據偏差

強調數據質量有助于公司減輕其AI項目中的偏見,這些偏見可能會隱藏起來,直到基于人工智能的解決方案進入市場。在這一點上,偏見可能很難糾正。

偏見通常來自項目開始時項目團隊或培訓數據中的盲點或無意識偏好。AI中的偏見可以表現為不同性別、口音或種族的語音或面部識別表現不均勻。隨著AI在我們的文化中變得越來越普遍,現在是時候解決內在的偏見了。

為了避免項目級別的偏見,在建設定義目標、路線圖、度量和算法團隊時需要積極保證多樣性。建設一個多樣化的數據人才團隊說起來容易做起來難,但風險很高。如果你團隊的內部構成不代表潛在客戶的外部構成,那么最終產品的風險只是為一小部分人工作,或者對他們有吸引力,而錯過了一個面向大眾市場的機會,或者更糟——偏見可能讓AI具備現實世界中的歧視。

5、必要時,實施數據安全保障

并非每個數據項目都使用個人身份信息(PII)或敏感數據。對于利用這類信息的解決方案,數據安全性比以往任何時候都更重要,特別是在處理客戶的PII、財務或政府記錄或用戶生成的內容時。越來越多的政府法規規定企業必須怎樣處理客戶信息。

保護這些機密數據可以保護你和你的客戶的信息。對實踐保持透明和道德準則,并堅持你的服務條款,這將給你帶來競爭優勢。不這樣做會讓你面臨丑聞和品牌負面影響的風險。

6、選擇合適的技術

你的訓練數據越復雜或微妙,結果就越好。大多數組織都需要大量高質量、快速且大規模的訓練數據。為了實現這一點,他們必須構建一個數據渠道,以更新模型所需的速度交付足夠的數據量。這就是為什么,采用正確的數據注釋技術是至關重要的。

你選擇的工具必須能夠為你的項目處理適當的數據類型,允許靈活的標記工作流設計,可管理單個注釋器的質量和吞吐量,并提供ML輔助的數據標記來增強人工注釋器的性能。

制定策略保障AI項目成功

IHS Markit最近的一項研究顯示,87%的組織正在采用至少一種形式的變革性技術,比如人工智能,但只有26%的組織認為已經具備了適當的商業模式,可以從這些技術中獲取全部價值。

創建一個可靠的訓練數據策略是獲取AI價值的第一步。包括設置預算、確定數據源、確保質量和保證安全性。清晰的數據策略還有助于提供大多數ML模型定期更新所需的穩定的數據渠道。單獨的訓練數據策略并不能保證AI的成功,但它可以幫助企業更好地利用AI帶來的紅利。

分享到:0收藏

上一篇:盲目崇拜數據,是因為還不曾真正了解數據 互聯網大變局:從流量信仰到數據信仰下一篇:

聲明:該文章版權歸原作者所有,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請在30日內與本網聯系。
您閱讀這篇文章花了0
轉發這篇文章只需要1秒鐘
喜歡這篇 1
評論一下 0
凱派爾知識產權全新業務全面上線
相關文章
評論
試試以這些內容開始評論吧
登錄后發表評論
凱派爾知識產權全新業務全面上線
寧波城市站
金華城市站
×
#熱門搜索#
精選雙創服務
歷史搜索 清空

Tel:18514777506

關注微信公眾號

創頭條企服版APP

china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网
亚洲精品一区二区在线观看| 亚欧色一区w666天堂| 一级日本不卡的影视| 国产一二精品视频| 欧美日韩在线播放三区| 亚洲欧洲另类国产综合| 国产酒店精品激情| 91精品国产欧美一区二区成人| 最近中文字幕一区二区三区| 国产精品一区二区男女羞羞无遮挡| 欧美日韩一级视频| 亚洲欧美日韩在线播放| 懂色av噜噜一区二区三区av| 精品蜜桃在线看| 日精品一区二区| 欧美性色黄大片| 亚洲视频免费看| 成人国产精品免费| 久久综合久久久久88| 日韩精品电影在线观看| 欧洲av一区二区嗯嗯嗯啊| 中文字幕一区二区三区精华液| 国产最新精品精品你懂的| 日韩亚洲欧美在线观看| 视频一区免费在线观看| 欧美色视频在线观看| 亚洲三级视频在线观看| 成人av网站大全| 中文字幕不卡三区| 粉嫩一区二区三区在线看| 国产亚洲精品福利| 国产精品996| 国产亚洲精品资源在线26u| 国产曰批免费观看久久久| 精品久久久久久久久久久久包黑料 | 日日欢夜夜爽一区| 欧美日韩亚洲综合| 亚洲国产你懂的| 欧美性色黄大片| 亚洲一区二区三区三| 在线看日本不卡| 亚洲国产日韩a在线播放| 欧美午夜电影一区| 午夜av区久久| 91精品中文字幕一区二区三区| 日韩中文字幕一区二区三区| 91.成人天堂一区| 青青草91视频| 精品第一国产综合精品aⅴ| 国产一区三区三区| 欧美国产乱子伦| 99精品久久免费看蜜臀剧情介绍| 自拍偷拍欧美精品| 91精品1区2区| 亚洲成人一区在线| 91精品国产综合久久久久久久久久 | 色妹子一区二区| 一区二区日韩av| 欧美丝袜丝交足nylons| 五月天精品一区二区三区| 欧美一级久久久久久久大片| 国内成人免费视频| 中文字幕欧美激情| 色婷婷av一区二区三区大白胸| 亚洲成av人片在线观看| 欧美一级艳片视频免费观看| 中文幕一区二区三区久久蜜桃| 午夜欧美一区二区三区在线播放| 91成人国产精品| 亚洲国产精品一区二区www | 欧美日韩第一区日日骚| 亚洲电影激情视频网站| 在线电影一区二区三区| 久久成人免费网| 国产欧美一区二区精品久导航 | 欧美韩国日本综合| 91日韩精品一区| 香蕉加勒比综合久久| 精品毛片乱码1区2区3区| 成人免费毛片app| 亚洲国产va精品久久久不卡综合| 日韩欧美国产一区在线观看| www.66久久| 日韩高清在线不卡| 中文在线资源观看网站视频免费不卡 | 国产久卡久卡久卡久卡视频精品| 国产精品三级av| 欧美色综合影院| 国产一区二三区| 亚洲欧美色图小说| 91精品国产91久久久久久一区二区| 国模大尺度一区二区三区| 18成人在线视频| 91精品国产美女浴室洗澡无遮挡| 国产高清在线精品| 亚洲一区二区三区三| 精品99一区二区| 色狠狠色噜噜噜综合网| 久久99久国产精品黄毛片色诱| 亚洲欧洲精品一区二区精品久久久| 51午夜精品国产| 成人app软件下载大全免费| 五月婷婷久久综合| 国产精品久久久久久久久快鸭| 在线电影欧美成精品| jvid福利写真一区二区三区| 秋霞av亚洲一区二区三| 亚洲天堂网中文字| 欧美videofree性高清杂交| 色先锋aa成人| 国产精品18久久久久久久网站| 亚洲电影一级黄| 国产精品久久毛片| 欧美一区二区国产| 色综合天天性综合| 国产麻豆日韩欧美久久| 午夜激情久久久| 中文字幕一区三区| 精品少妇一区二区三区在线播放| 一本一本大道香蕉久在线精品| 国产精品一二一区| 日本美女一区二区| 亚洲一区二区三区四区的| 中文字幕乱码日本亚洲一区二区| 欧美一级日韩免费不卡| 91国内精品野花午夜精品 | 日韩电影在线一区二区三区| 国产农村妇女精品| 日韩一区二区免费高清| 色婷婷国产精品综合在线观看| 国产精品一区二区三区网站| 亚欧色一区w666天堂| 亚洲欧美视频一区| 国产欧美精品区一区二区三区 | 韩国av一区二区三区在线观看| 亚洲综合自拍偷拍| 国产精品嫩草影院com| 欧美变态凌虐bdsm| 91精品国产色综合久久ai换脸| 在线观看视频91| 又紧又大又爽精品一区二区| 国产午夜精品久久久久久久| 欧美一级二级三级蜜桃| 91九色02白丝porn| 97精品电影院| 成人黄色在线看| 国产成人在线视频网站| 激情五月播播久久久精品| 日韩成人精品视频| 亚洲二区视频在线| 亚洲精品久久久久久国产精华液| 国产精品免费看片| 国产农村妇女精品| 国产欧美日韩精品在线| 久久久久亚洲蜜桃| 久久丝袜美腿综合| 2020日本不卡一区二区视频| 欧美成人一级视频| 欧美va亚洲va| 欧美精品一区二区三区蜜臀| 日韩欧美国产一区在线观看| 9191成人精品久久| 欧美一区二区视频在线观看2022| 69久久夜色精品国产69蝌蚪网| 欧美情侣在线播放| 91精品国产91久久综合桃花| 91麻豆精品国产自产在线| 欧美一区二区三区四区在线观看| 欧美一区二区三区免费大片| 欧美一二三四在线| 精品日产卡一卡二卡麻豆| 久久夜色精品国产噜噜av| 久久久.com| 国产清纯美女被跳蛋高潮一区二区久久w| 精品久久久久久亚洲综合网| 26uuu国产在线精品一区二区| 亚洲精品一区二区三区四区高清 | 九九热在线视频观看这里只有精品| 日本大胆欧美人术艺术动态| 美女视频黄频大全不卡视频在线播放| 日本欧美一区二区在线观看| 日韩激情在线观看| 麻豆精品一区二区av白丝在线| 美女视频网站久久| 国产伦精品一区二区三区在线观看| 国产精品夜夜嗨| 不卡电影一区二区三区| 91麻豆国产自产在线观看| 在线精品视频免费观看| 欧美日韩第一区日日骚| 日韩免费观看高清完整版| 久久久不卡影院| 国产精品不卡一区二区三区| 一二三四社区欧美黄| 日韩高清在线电影| 国产麻豆一精品一av一免费| av一二三不卡影片| 日本韩国视频一区二区| 在线播放中文一区| 久久嫩草精品久久久精品|