使用sphinx search測試中文搜索引擎【轉發】

Submitted by neurta on Wed, 02/26/2020 - 12:54
以上是及時建立實時索引的python程序的主要部分??梢园阉O置成后臺一直運行的守護程序,也可以在crontab里面配置每隔幾分鐘運行一次。 索引的更新? 靜態的主索引如果只建立一次,實時索引的數據量會越積越多,對實時索引的搜索帶來很大壓力,所以我們要定時重新建立主索引,清理實時索引。 清理實時索引的程序可以參考上面建立實時索引的python程序。

一種基于SIFT和DDIS的智能立體倉庫貨物自動識別方法

Submitted by neurta on Mon, 02/24/2020 - 10:24
發明公開一種基于SIFT和DDIS的智能立體倉庫貨物自動識別方法,包括以下步驟:S1、采集待匹配貨物圖像,將待匹配貨物圖像進行預處理,得到預處理圖像;S2、對預處理圖像進行目標提取,得到匹配模板圖像;S3、采用SIFT特征匹配法對匹配模板圖像與圖像庫進行粗匹配,并進行匹配對數判別;S4、采用DDIS模板匹配法對無法識別的匹配模板圖像與圖像庫進行精匹配。對倉庫貨物圖像進行SIFT特征匹配與DDIS模板匹配方法相結合,能將復雜貨物圖像較準確地識別出來,通過對貨物圖像的預處理以及目標提取,減少了識別所需時間,滿足倉庫貨物識別要求的實時性。

一種基于相關性分析的神經網絡自組織遺傳進化算法

Submitted by neurta on Mon, 02/10/2020 - 10:49
一種基于相關性分析的神經網絡自組織遺傳進化算法,構建初始神經網絡,初始神經網絡只包含輸入層和輸出層;采用BP算法訓練網絡,并記錄訓練日志數據;獲取鏈接相關性,優化神經網絡;復雜化神經網絡;融合遺傳進化算法迭代神經網絡,輸出最優神經網絡模型。發明輸出最優模型的迭代次數由于NEAT輸出最優模型的迭代次數,輸出最優的神經網絡模型之前所進行的bp調節次數少于普通的bp神經網絡所需要的調節次數,通過使用不同數據集進行相關實驗對算法性能(準確率)進行驗證,結果表明在分類問題發明的表現相當優秀。

一種基于數據挖掘和可視化的電網事故關聯原因回溯方法

Submitted by neurta on Sun, 02/09/2020 - 09:43
發明涉及一種基于數據挖掘和可視化的電網事故關聯原因回溯方法,屬于智能檢索領域,該方法包括以下步驟:s1:數據挖掘,S2:事故追溯檢索,s3:結合詞庫關聯規則展示追溯過程;發明再電力系統處于運行狀態時,如果系統出現問題,保護裝置的動作信息就會把故障的有關信息傳送給調度中心,通過將故障信息導入到智能分析系統中,建立故障數據挖掘算法,可以對故障的數據進行分析,提取故障特征,再收集歷史事故事件數據,再根據這些元素相關聯的其他運行信息,進行網狀拓撲展示,輔助調度人員進行事故事件數據,再根據這些元素相關聯的其他運行信息,進行網狀拓撲展示,輔助調度人員進行事故事件的調查,使之成為系統運行人員對電力系統故障進行快速判斷和處理的依據

一種基于圖像分割及動態閾值的字幕提取方法

Submitted by neurta on Sat, 02/08/2020 - 08:51
本發明公開了一種基于圖像分割及動態閾值的字幕提取方法,包括步驟:s1、遍歷視頻內某一時段含字幕的視頻幀,做輪廓查找和劃定輪廓外部矩形邊界的操作;s2、分析矩形邊界的特征,獲取字幕區域的位置;s3、取定間隔的視頻幀,對所述字幕區域進行圖像分割;S4、對分割后的圖形進行灰度化處理,根據灰度圖像的像素直方分布獲取二值化的動態閾值;S5、基于前序步驟中獲得的動態閾值進行圖像二值化操作,突出字幕圖形,消除噪聲像素點;S6、根據所述的動態閾值以及二值化圖像進行判斷,對不包含字幕的圖像進行忽略,僅對包含字幕的圖像進行字符識別;s7、匯總識別結果去重去冗;最終獲得按時間排序的字幕文本文件

一種基于互聯網數據采集的情緒指數構建方法

Submitted by neurta on Fri, 02/07/2020 - 09:06
本發明公開一種基于互聯網數據采集的情緒指數構建方法,包括如下步驟:步驟1,獲取互聯網數據中針對某項投資的關注程度;步驟2,構建正負情緒指標;步驟3,從公開市場獲取當月ipo數量和當日股票價格波動兩項指標;步驟4,根據如下公式計算市場投資情緒指數;市場投資者情緒指數=【A/(A+B+C+D)】關注程度+【b/(A+B+C+D)】

一種基于神經網絡的智能病案文字識別的方法

Submitted by neurta on Thu, 02/06/2020 - 11:12
發明提供了一種基于神經網絡的智能病案文字識別的方法,發明通過新設計的卷積神經網絡模塊和雙層神經網絡的結合,新的卷積神經網絡模塊能加深神經網絡的深度,將卷積后的特征圖進行雙層雙向神經網絡的處理,充分考慮到圖片每一切片之間的聯系,隨著神經網絡深度的加深,不會產生梯度消失的問題,還能更好的提取特征,使得本識別算法在通用文本及病案文本的識別準確率上顯著提高,特別是比現有的ocr識別病案的準確率高,準確度達到98.3%,其次,本發明的算法數據集增加醫學用詞及醫學用詞訓練數據,增加了醫學用詞的預測能力,再有,本發明的數據集是通過真實病案數據制作的數據集,能夠有效的消除背景的影響

基因關聯分析的修正方法及修正裝置

Submitted by Anonymous (not verified) on Wed, 02/05/2020 - 15:05
本發明公開了一種基因關聯分析的修正方法及修正裝置,其中,方法包括:獲取新的樣本的基因序列:生成新的原本:對所述的樣本進行標簽賦值,其中,將所述新的樣本進行標簽賦值,其中,將所述新的樣本與預設的患病以及健康的樣本進行比對,以確定所屬類別并放棄或者保留;重復執行所述獲取序列步驟,以得到滿足預設條件的多個樣本,并獲取新的數據集以進行基于回歸方程的似然比檢驗,該方法可以保持原有數據中內在的基因信息,同時不違背原有的統計檢驗框架,從而原有的統計檢驗方法也可以直接使用,提高修正的適用性和準確性,簡單易實現。

一種基于改進的Apriori算法的機床故障預測方法

Submitted by neurta on Mon, 01/20/2020 - 10:02
通過對機床故障的預測分析,可以在一定程度上降低或者避免因機床損失,而造成的工業生成中的經濟損失。目前已有的預防技術有傳統方法和在線監測方法兩大類,其中傳統技術是指由技術人員定期或不定期的對機床的噪音、溫度、轉速等狀態因素進行判斷,推測機床的健康狀態;而在線檢測方法主要通過相關系統實時監控主軸電流、扭矩、振動、聲音和溫度等機床狀態,將采集到的數據進行分析判斷,從而推斷機床健康程度。傳統方法存在技術人員的專業能力的主觀因素,無法保證準確性,可靠性差且效率低;而在線監測方法,實時性要求高,隨著機床數據的不斷增加,傳統的集中式數據庫技術會給網絡流量和服務器帶來一定的壓力。
冯仰妍破处门