理解條件隨機場

Submitted by huzhenda on Sat, 07/14/2018 - 11:47

? ? ? ? 條件隨機場(conditional random fields,簡稱 CRF),是一種判別式概率模型,是給定一組輸入序列條件下另一組輸出序列的條件概率分布模型,常用于標注或分析序列資料。

1、哪些問題需要用到CRF模型

? ? ? ? ?我們以自然語言處理中的詞性標注(POS Tagging)作為例子。詞性標注的目標是給出一個句子中每個詞的詞性(名詞,動詞,形容詞等)。而這些詞的詞性往往和上下文詞的詞性有關,因此,使用CRF來處理是很適合的。

2、從隨機場到馬爾可夫隨機場

? ? ? ? 首先,我們來介紹隨機場。隨機場是由若干個位置組成的整體,當給每一個位置中按照某種分布隨機賦予一個值之后,其全體就叫做隨機場。以詞性標注為例:假如我們需要對一個包含十個詞的句子做詞性標注。這十個詞每個詞的詞性可以在我們已知的詞性集合(名詞,動詞...)中選擇。當我們為每個詞選擇完詞性后,這就形成了一個隨機場。

用python分析熱門奪冠球隊

Submitted by yangjingbang on Sat, 06/16/2018 - 19:42

2018年,火熱的世界杯即將拉開序幕。在比賽開始之前,我們不妨用 Python 來對參賽隊伍的實力情況進行分析,并大膽的預測下本屆世界杯的奪冠熱門球隊。

通過數據分析,可以發現很多有趣的結果,比如:

  • 找出哪些隊伍是首次進入世界杯的黑馬隊伍
  • 找出2018年32強中之前已經進入過世界杯,但在世界杯上沒有贏得過一場比賽的隊伍

當然,我們本次的主要任務是要通過數據分析來預測2018年世界杯的奪冠熱門隊伍。

本次分析的數據來源于 Kaggle, 包含從 1872 年到今年的數據,包括世界杯比賽、世界杯預選賽、亞洲杯、歐洲杯、國家之間的友誼賽等比賽,一共大約 40000 場比賽的情況。

本次的環境為

  • window 7 系統
  • python 3.6
  • Jupyter Notebook
  • pandas version 0.22.0

先來看看數據的情況:

步態識別的深度學習:綜述

Submitted by yangjingbang on Fri, 06/15/2018 - 16:22
由于步態容易受到物體遮擋、衣著、視角和攜帶物等協變量因素的影響,步態識別方法較難獲得較優的識別性能.基于端到端和多層特征提取的思想,深度學習近年在步態識別領域取得一系列進展.本文綜述深度學習在步態識別中的研究現狀、優勢和不足,總結其中的關鍵技術和潛在的研究方向.

機器學習中的五種回歸損失函數

Submitted by chenrouyu on Sat, 06/09/2018 - 13:20
機器學習中的所有算法最后都歸結到求一個函數的最值問題,我們稱之為目標函數。需要我們去最小化的函數稱之為損失函數。損失函數可以看作是用來判斷預測模型好壞的度量。尋找一個函數最小點的方法是“梯度下降”。損失函數就好像是一個起伏的山脈,梯度下降法就是在尋找山的最低點。對于不同的模型,不同的數據存在許多不同的損失函數,損失函數的選擇與很多因素有關,比如異常點、機器學習算法選擇、梯度下降快慢、求導的難易程度以及預測的置信區間等。這篇文章的目的就說介紹不同的損失函數。 損失函數可以被分為兩大類:對分類問題(離散)和對回歸問題(連續)。本文介紹針對回歸問題的損失函數。

機器學習預測混亂的超能力

Submitted by chenrouyu on Fri, 06/01/2018 - 17:54

半個世紀之前,“混沌理論”的發明者們就認為“蝴蝶效應”使長期預測變成了可能。在一個復雜系統(比如天氣,金融或者其他的)中的微小擾動,都能引發一系列相關事物發生改變,他們會影響到未來。因為我們無法確定這些系統的準確狀態,也就無法預測他們會如何變化,所以我們活在不確定中。

但是現在機器人可以幫助我們減少這樣的不確定性。

在許多研究中,科學家們已經用機器學習——人工智能背后相同的計算機技術,來預測很久之后的混沌系統的未來發展。其他的科學及認為這種方法是基礎,并可能有更廣闊的應用。

這個發現來自于資深的混沌理論研究者Edward Ott和四名Maryland 大學的合作者。他們運用了一個名叫reservoir computing 的機器學習算法,來學習原型混沌系統的動力學,也就是Kuramoto-Sivashinsky方程。

從Kuramoto-Sivashinsky方程之前的演化中得到數據來訓練之后,研究者們能夠近似預測活躍系統在未來8倍的“Lyapunov times”如何進化,比之前的方法快8倍還多。Lyapunov time是衡量一個動力系統的混沌時間狀態,他一般控制了我們能夠預測的時間邊界。

騰訊圖像去模糊、自動人像操縱最新研究

Submitted by chenrouyu on Wed, 05/30/2018 - 13:13
解密運動模糊:走向實用的非特定場景圖片去模糊技術 在慢速曝光或快速運動拍攝照片時,圖像模糊常常困擾著照片拍攝者。優圖實驗室的研究人員開發了可以恢復模糊圖像的有效新算法。 在此之前,圖像去模糊一直是圖像處理中困擾業界的難題。 圖像模糊產生的原因可能非常復雜。比如,相機晃動,失焦,拍攝物體高速運動等等?,F有的圖片編輯軟件中的工具通常不盡如人意,例如,Photoshop CC中的“相機抖動還原”工具,只能處理簡單的相機平移抖動模糊。 這種類型的模糊在計算機視覺業內被稱為“均勻模糊”。而大部分模糊圖片并不是“均勻模糊”的,因而現有圖片編輯軟件的應用十分有限。

基于注意力機制的對抗網絡

Submitted by chenrouyu on Mon, 05/28/2018 - 20:12
本文中我們提出了基于注意力機制的對抗網絡(Self-Attention Generative Adversarial Network (SAGAN))。他由注意力機制驅動,可用于圖形生成任務中的遠程依賴關系建模。傳統的卷積GANs僅對低分辨率圖像集中的空間局部點做高分辨率的細節處理。在基于注意力機制的對抗網絡中,可以對所有局部特征做細節處理。鑒別器還能判斷相距很遠的高分辨率特征是否彼此相符。最近研究表明生成器的條件也會影響到GAN的表現。為了平衡這個帶來的影響,我們在GAN生成層中運用光譜歸一化,這也能提高我們的訓練效率。注意層的可視化顯示,生成器利用與物體形狀相對應的鄰域而不是固定形狀的局部區域。
冯仰妍破处门