特斯拉CEO馬斯克:人工智能是人類文明最大的威脅

Submitted by pengkun on Mon, 07/17/2017 - 09:14

據外媒報道,周六在出席全美國州長協會的會議時,特斯拉CEO伊隆-馬斯克(Elon Musk)強調稱人工智能是“我們人類文明面臨的最大威脅”,并呼吁政府迅速而堅決地進行干預,監督這項技術的發展。

????????“在人工智能領域,我見過最先進的人工智能技術。我想,人們真的應該擔心它?!瘪R斯克在與內華達州州長布賴恩-桑多瓦爾(Brian Sandoval)交談時說。

????????很長時間以來,馬斯克一直在大聲疾呼人工智能的威脅。但是,他在全美國州長們面前的一席話特別令人矚目,這不僅是因為他重點強調人工智能的巨大威脅,而且還強烈呼吁政府進行干預。

????????“就人工智能而言,我們需要在管制上更具有前瞻性,而不是消極應對。因為等到我們制定出人工智能管理規定的時候,已經太晚了?!彼f。然后,馬斯克比較了人工智能和傳統管理目標,并聲稱,“人工智能是關系人類文明存亡的最大威脅,這是汽車事故、飛機墜毀、濫用藥物或劣質食品都比不了的威脅?!?/span>

專訪 | 楊強教授談CCAI、深度學習泡沫與人工智能入門

Submitted by shiwenbin on Mon, 07/17/2017 - 09:07
7 月 22 - 23 日,由中國人工智能學會、阿里巴巴集團 & 螞蟻金服主辦,CSDN、中國科學院自動化研究所承辦的第三屆中國人工智能大會(CCAI 2017)將在杭州國際會議中心盛大開幕。 作為大會主席,香港科技大學計算機與工程系主任、AAAI Fellow 楊強教授最近接受了大會記者專訪。這次訪談干貨滿滿,其中有不少話題是楊強教授首度公開談及,比如下一個 AI 突破口、深度學習泡沫、AI 之路心得、本科生入門 AI、好學生要能教導師學習,等等。

圖像特征提取三大法寶:HOG特征,LBP特征,Haar特征

Submitted by wangqingqing on Fri, 07/14/2017 - 15:10
方向梯度直方圖(Histogram of Oriented Gradient, HOG)特征是一種在計算機視覺和圖像處理中用來進行物體檢測的特征描述子。它通過計算和統計圖像局部區域的梯度方向直方圖來構成特征。Hog特征結合 SVM分類器已經被廣泛應用于圖像識別中,尤其在行人檢測中獲得了極大的成功。需要提醒的是,HOG+SVM進行行人檢測的方法是法國研究人員Dalal 在2005的CVPR上提出的,而如今雖然有很多行人檢測算法不斷提出,但基本都是以HOG+SVM的思路為主。 (1)主要思想: 在一副圖像中,局部目標的表象和形狀(appearance and shape)能夠被梯度或邊緣的方向密度分布很好地描述。(本質:梯度的統計信息,而梯度主要存在于邊緣的地方)。 (2)具體的實現方法是: 首先將圖像分成小的連通區域,我們把它叫細胞單元。然后采集細胞單元中各像素點的梯度的或邊緣的方向直方圖。最后把這些直方圖組合起來就可以構成特征描述器。 (3)提高性能: 把這些局部直方圖在圖像的更大的范圍內(我們把它叫區間或block)進行對比度歸一化(contrast-normalized),所采用的方 法是:先計算各直方圖在這個區間(block)中的密度,然后根據這個密度對區間中的各個細胞單元做歸一化。通過這個歸一化后,能對光照變化和陰影獲得更 好的效果。 (4)優點: 與其他的特征描述方法相比,HOG有很多優點。首先,由于HOG是在圖像的局部方格單元上操作,所以它對圖像幾何的和光學的形變都能保持很好的不 變性,這兩種形變只會出現在更大的空間領域上。其次,在粗的空域抽樣、精細的方向抽樣以及較強的局部光學歸一化等條件下,只要行人大體上能夠保持直立的姿 勢,可以容許行人有一些細微的肢體動作,這些細微的動作可以被忽略而不影響檢測效果。因此HOG特征是特別適合于做圖像中的人體檢測的。 2、HOG特征提取算法的實現過程: 大概過程: HOG特征提取方法就是將一個image(你要檢測的目標或者掃描窗口): 1)灰度化(將圖像看做一個x,y,z(灰度)的三維圖像); 2)采用Gamma校正法對輸入圖像進行顏色空間的標準化(歸一化);目的是調節圖像的對比度,降低圖像局部的陰影和光照

共享單車上的智能鎖,做出來有多難?

Submitted by zhongzhimin on Fri, 07/14/2017 - 14:55
我們都體驗過共享單車的開鎖方式:用手機掃描車上的二維碼,APP 上出現解鎖進度的讀條,10秒內就會聽到電機帶動和鎖鞘“啪”的一聲,解鎖成功。我們可以直接把鎖內的 GSM 模塊當成是當年的插了SIM卡的黑白功能手機,10秒內的時間,GSM 搜索網絡時間沒有這么短,更何況在解鎖的過程中,我們僅僅是用手機掃碼,沒有任何激活單車的操作,所以可以肯定鎖是始終與網絡保持長連接的,就是說這個手機始終是開機的狀態,時刻要接收信號。 一開始以摩拜為代表的共享單車的開鎖過程比現在慢多了,每次開鎖大概在6~10秒,但極少開鎖失敗。筆者很早就注冊使用共享單車,對此深有體會。原因其實是最開始的共享單車,開鎖并不是使用GPRS流量來控制的,而是服務器通過給自行車發短信(對,就是手機短信),響應然后開鎖。6至10秒的延時也正正是短信投遞的時間。 早期的共享單車使用短信開鎖 短信開鎖的方式有其優勢:開鎖比較穩定,開鎖不需要通過GPRS/3G流量,比較省電。省電是非常重要的,前期由于共享出行尚未普及,而單車是需要使用者發電維持的(相信大家都知道摩拜初代用的是軸承不是鏈條,靠我們騎車來發電),如果某輛車一直沒人騎,等到它的電量耗盡變成一輛“僵尸車”,一旦這種情況多起來,線下維護的成本就非常高。 沒想到吧,最開始的共享單車是以短信作為開鎖信號! GPRS開鎖: 接下來共享單車開鎖方式就直接由服務器通過GPRS/3G流量傳達指令開鎖。不再擔心電量的問題,這種變化是可預見的,因為騎車的人多起來了嘛!通過流量直接開鎖,開鎖速度也大大提升,從原來靠短信,等待時間有時候要30秒、1分鐘(短信收發有時候還不止這么久)變成了3秒內開鎖,照顧到很多人的用戶體驗。但問題隨之而來:開鎖時間,開鎖成功率依賴信號,在信號不強的地區開鎖也是十分痛苦的。 GPRS + 藍牙開鎖:

python大規模數據處理技巧之一:數據常用操作

Submitted by wukezhou on Fri, 07/14/2017 - 13:48
故接下來的幾個文章將會整理在關于在大規模數據實踐上遇到的一些問題,文章中總結的技巧基本是基于pandas,有錯誤之處望指正。 1、外部csv文件讀寫 大數據量csv讀入到內存 分析思路:數據量非常大時,比如一份銀行一個月的流水賬單,可能有高達幾千萬的record。對于一般性能的計算機,有或者是讀入到特殊的數據結構中,內存的存儲可能就非常吃力了??紤]到我們使用數據的實際情況,并不需要將所有的數據提取出內存。當然讀入數據庫是件比較明智的做法。若不用數據庫呢?可將大文件拆分成小塊按塊讀入后,這樣可減少內存的存儲與計算資源 注意事項:open(file.csv)與pandas包的pd.read_csv(file.csv ): python32位的話會限制內存,提示太大的數據導致內存錯誤。解決方法是裝python64位。如果嫌python各種包安裝過程麻煩,可以直接安裝Anaconda2 64位版本 簡易使用方法: chunker = pd.read_csv(PATH_LOAD, chunksize = CHUNK_SIZE) 讀取需要的列: columns = ("date_time", "user_id") chunks_train = pd.read_csv(filename, usecols = columns, chunksize = 100000) chunker對象指向了多個分塊對象,但并沒有將實際數據先讀入,而是在提取數據時才將數據提

如何使用Python處理Missing Data

Submitted by shiwenbin on Fri, 07/14/2017 - 09:20
現實世界的數據中常常包含缺失的數據。原因很多,比如觀察結果沒有記錄,或數據損壞。處理缺失的數據很重要,因為許多機器學習算法不支持具有缺失值的數據庫。 本教程將討論如何使用Python處理缺失的數據來進行機器學習。

谷歌DeepMind拓展人工智能新方向:教AI行走

Submitted by pengkun on Fri, 07/14/2017 - 09:18
DeepMind技術公司已經開發出多種人工智能方案,其不僅擊敗了全球最頂尖的圍棋選手,同時亦在數十種傳統視頻游戲當中創下新紀錄。如今,這家由谷歌持有的技術廠商開始著眼于更為復雜的發展方向:指導AI如何行走。

最全技術圖譜!一文掌握人工智能各大分支技術

Submitted by zhongzhimin on Thu, 07/13/2017 - 16:12
尼爾遜教授對人工智能下了這樣一個定義:“人工智能是關于知識的學科――怎樣表示知識以及怎樣獲得知識并使用知識的科學?!倍硪粋€美國麻省理工學院的溫斯頓教授認為:“人工智能就是研究如何使計算機去做過去只有人才能做的智能工作?!边@些說法反映了人工智能學科的基本思想和基本內容。即人工智能是研究人類智能活動的規律,構造具有一定智能的人工系統,研究如何讓計算機去完成以往需要人的智力才能勝任的工作,也就是研究如何應用計算機的軟硬件來模擬人類某些智能行為的基本理論、方法和技術。 人工智能是計算機學科的一個分支,二十世紀七十年代以來被稱為世界三大尖端技術之一(空間技術、能源技術、人工智能)。也被認為是二十一世紀三大尖端技術(基因工程、納米科學、人工智能)之一。這是因為近三十年來它獲得了迅速的發展,在很多學科領域都獲得了廣泛應用,并取得了豐碩的成果,人工智能已逐步成為一個獨立的分支,無論在理論和實踐上都已自成一個系統。

圖形解鎖驗證碼破解(附Python代碼)

Submitted by wangqingqing on Thu, 07/13/2017 - 14:02
前言: 爬蟲開源死得快,新浪微博又改策略了。在去年的這個時候,微博還是沒什么限制的。2016年12月我將新浪微博爬蟲的代碼作了一次更新,并將文章轉到了知乎,爬微博的人似乎從那個時候開始多了許多。也許是這個緣故,微博開始對IP設了限制,接著禁了原來免驗證碼的登錄方式,現在將weibo.cn的登錄途徑也關了,weibo.cn采用m.weibo.cn的登錄,登錄過程中可能出現圖形解鎖驗證碼。這種驗證碼比較少見,因為多用在手機平臺。 我懷疑QQ交流群(537549079)里應該是有新浪微博反爬蟲的人,不過這也沒什么關系,我們做爬蟲的,本來就是帶頭“制造麻煩”的人,沒有被請去喝茶,就已經要感恩了。另外需要聲明一點,其實我個人并不需要微博數據,平時自己也沒有爬,只是出于責任,既然把項目開源了,就有義務持續維護更新下去。另外是出于興趣愛好,作為一名爬蟲工作者,出現了新的反爬機制,我自己也是很興奮 很想去研究突破的

Stock Price Prediction With Big Data and Machine Learning(如何用大數據和機器學習預測股票市場)

Submitted by like on Thu, 07/13/2017 - 10:00
Synopsis This post is based on Modeling high-frequency limit order book dynamics with support vector machines paper. Roughly speaking I’m implementing ideas introduced in this paper in scala with Spark and Spark MLLib. Authors are using sampling, I’m going to use full order log from NYSE (sample data is available from NYSE FTP), just because I can easily do it with Spark. Instead of using SVM, I’m going to use Decision Tree algorithm for classification, because in Spark MLLib it supports multiclass classification out of the box. If you want to get deep understanding of the problem and proposed solution, you need to read the paper. I’m going to give high level overview of the problem in less academic language, in one or two paragraphs. Predictive modelling is the process by which a model is created or chosen to try to best predict the probability of an outcome.
冯仰妍破处门