《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 設(shè)計(jì)應(yīng)用 > 一種基于Yarn云平臺(tái)的基因啟發(fā)式多序列比對(duì)算法
一種基于Yarn云平臺(tái)的基因啟發(fā)式多序列比對(duì)算法
電子技術(shù)應(yīng)用
楊波1,徐勝超1,周繼鵬2,王志堅(jiān)1
1.廣州華商學(xué)院 人工智能學(xué)院;2.暨南大學(xué) 信息科學(xué)技術(shù)學(xué)院
摘要: 提出一種基于Yarn云平臺(tái)的基因啟發(fā)式多序列比對(duì)算法。建立核酸替換等價(jià)矩陣作為基因啟發(fā)式數(shù)學(xué)模型,構(gòu)建Yarn云平臺(tái)邏輯架構(gòu),通過(guò)對(duì)基因數(shù)據(jù)預(yù)處理、基因數(shù)據(jù)存儲(chǔ)、基因序列比對(duì)、基因數(shù)據(jù)管理、基因數(shù)據(jù)分析等步驟,對(duì)數(shù)據(jù)分類(lèi)保存,劃分錯(cuò)誤率較高的長(zhǎng)序列,得到多個(gè)較短的基因片段。對(duì)不同片段實(shí)施定位,將其中的變長(zhǎng)種子生成,進(jìn)行骨架構(gòu)建和孔隙填補(bǔ),可以實(shí)現(xiàn)基因啟發(fā)式多序列比對(duì)。結(jié)果表明,設(shè)計(jì)的算法在不同數(shù)據(jù)集下處理時(shí)間縮短,多序列比對(duì)SP(Sum of Pairs)的分值較高,實(shí)驗(yàn)驗(yàn)證了該多序列比對(duì)方法具有很好的應(yīng)用價(jià)值。
中圖分類(lèi)號(hào):TP393.4 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.245448
中文引用格式: 楊波,徐勝超,周繼鵬,等. 一種基于Yarn云平臺(tái)的基因啟發(fā)式多序列比對(duì)算法[J]. 電子技術(shù)應(yīng)用,2024,50(11):16-22.
英文引用格式: Yang Bo,Xu Shengchao,Zhou Jipeng,et al. Gene heuristic multi sequence alignment algorithm based on Yarn cloud platform[J]. Application of Electronic Technique,2024,50(11):16-22.
Gene heuristic multi sequence alignment algorithm based on Yarn cloud platform
Yang Bo1,Xu Shengchao1,Zhou Jipeng2,Wang Zhijian1
1.School of Artificial Intelligent, Guangzhou Huashang College; 2.School of Information Science and Technology, Jinan University
Abstract: This paper proposes a gene heuristic multi sequence alignment algorithm based on the Yarn cloud platform. Establish a nucleic acid replacement equivalence matrix as a genetic heuristic mathematical model, construct the Yarn cloud platform logical architecture, and classify and save the data through steps such as gene data preprocessing, gene data storage, gene data alignment, gene data management, and gene data analysis. Divide long sequences with high error rates, and obtain multiple shorter gene fragments. Implementing localization on different fragments, generating variable length seeds, constructing skeletons and filling gaps, can achieve gene heuristic multi sequence alignment. The results show that the designed algorithm reduces processing time on different datasets, and the sum of pairs (SP) score for multi sequence alignment is higher. This experiment verifies the practicality of the multi sequence alignment method.
Key words : biological data;parallel computing;distributed computing architecture;distributed database system;big data processing platform

引言

生物序列對(duì)比是生物信息學(xué)領(lǐng)域的核心內(nèi)容。由于不同物種的基因序列長(zhǎng)度不同,大量的重復(fù)序列高頻率出現(xiàn)在每個(gè)物種的基因組中,因此每個(gè)物種都有一個(gè)多序列比對(duì)問(wèn)題。最重要的工作是建立基因數(shù)據(jù)庫(kù),在基因數(shù)據(jù)庫(kù)的建立過(guò)程中,對(duì)于基因啟發(fā)式的多序列比對(duì)研究是重中之重。在比對(duì)的過(guò)程中,通過(guò)比較不同物種或同一物種不同基因的DNA序列,基因啟發(fā)式多序列比對(duì)算法有助于理解基因的進(jìn)化歷史、功能和結(jié)構(gòu),通過(guò)比對(duì)多個(gè)基因序列的相似性和差異性,可以推斷出這些物種之間的進(jìn)化關(guān)系,從而了解物種之間是否有親緣關(guān)系和演化到目前為止的歷程。基因啟發(fā)式多序列比對(duì)算法可以找出多個(gè)基因序列之間的共同結(jié)構(gòu)和功能區(qū)域,這有助于預(yù)測(cè)新的基因功能,為藥物設(shè)計(jì)和疾病治療提供重要信息。總之,基因啟發(fā)式多序列對(duì)比算法可以揭示基因的多種特點(diǎn)和規(guī)律,為生物學(xué)、醫(yī)學(xué)和農(nóng)業(yè)等領(lǐng)域的研究提供重要支持。

國(guó)內(nèi)外眾多學(xué)者都對(duì)基因比對(duì)算法有著深入研究。文獻(xiàn)[1]提出了一種基于序列長(zhǎng)度的高效多序列比對(duì)算法,該算法首先根據(jù)基因序列的長(zhǎng)度將其劃分為若干段,然后對(duì)每個(gè)分段排序,并與原始序列比對(duì)。文獻(xiàn)[2]介紹了一種基于時(shí)間窗的DNA序列分段方法,該方法的核心步驟是將DNA序列依據(jù)其長(zhǎng)度切割成多個(gè)區(qū)間,并對(duì)這些區(qū)間逐一比較分析。而文獻(xiàn)[3]則側(cè)重于基因序列比對(duì)原理的探討,通過(guò)引入Logistic映射對(duì)混沌遺傳算法的優(yōu)化,有效提升了算法的收斂速度。在算法設(shè)計(jì)中,它明確了基因序列的遺傳編碼方式,并計(jì)算了相應(yīng)的適應(yīng)度值,同時(shí)考慮了堿基缺失情況的影響。此外,文中還設(shè)計(jì)了混沌遺傳算子,實(shí)施了混沌變異操作,從而實(shí)現(xiàn)了基因序列的比對(duì)。文獻(xiàn)[4]則提出了一種基于啟發(fā)式策略的多序列比對(duì)算法。該算法首先利用啟發(fā)式策略對(duì)多個(gè)基因排序,然后將所有排序后的結(jié)果比對(duì)。然而,DNA序列比對(duì)算法在實(shí)踐中也面臨一些挑戰(zhàn)。由于DNA序列通常較長(zhǎng)且序列間重疊率高,傳統(tǒng)的比對(duì)算法往往耗時(shí)較長(zhǎng)。同時(shí),由于DNA序列的穩(wěn)定性以及比對(duì)結(jié)果的單一性,基因數(shù)據(jù)信息在比對(duì)過(guò)程中損失較大,這在一定程度上影響了比對(duì)的準(zhǔn)確性。因此,如何快速且準(zhǔn)確地完成多個(gè)基因的比對(duì),成為當(dāng)前亟待解決的問(wèn)題[5-8]。

云平臺(tái)能夠共享龐大的計(jì)算資源,并以服務(wù)的形式提供給用戶,讓用戶能夠按需靈活使用。Yarn云平臺(tái)是云計(jì)算Apache Hadoop2.0生態(tài)系統(tǒng)中的一個(gè)關(guān)鍵組件,是用于資源管理和作業(yè)調(diào)度的分布式計(jì)算框架。利用Yarn在云環(huán)境中提供資源分配、作業(yè)調(diào)度和容錯(cuò)能力,使用戶能夠高效地利用云計(jì)算提供的計(jì)算能力。本文提出了一種基于Yarn云平臺(tái)的基因啟發(fā)式多序列比對(duì)算法,旨在提高比對(duì)效率和準(zhǔn)確性。結(jié)合生物知識(shí)建立基因啟發(fā)式數(shù)學(xué)模型,構(gòu)建Yarn云平臺(tái)邏輯架構(gòu),針對(duì)處理后的數(shù)據(jù)并行計(jì)算,提高處理效率,利用HBase數(shù)據(jù)庫(kù)和基因段編碼模塊對(duì)數(shù)據(jù)的存儲(chǔ)和處理,將序列比對(duì)的結(jié)果展示在數(shù)據(jù)庫(kù)中。通過(guò)實(shí)驗(yàn)結(jié)果可知,本文的方法運(yùn)行時(shí)間較短且SP分值高于0.9,具有良好的應(yīng)用性能。


本文詳細(xì)內(nèi)容請(qǐng)下載:

http://m.jysgc.com/resource/share/2000006204


作者信息:

楊波1,徐勝超1,周繼鵬2,王志堅(jiān)1

(1.廣州華商學(xué)院 人工智能學(xué)院, 廣東  廣州511300;

2.暨南大學(xué) 信息科學(xué)技術(shù)學(xué)院, 廣東 廣州510632)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
久久精品91久久久久久再现| 欧美日韩国内| 亚洲精品免费一二三区| 亚洲欧美日韩视频二区| 99v久久综合狠狠综合久久| 在线观看欧美日韩国产| 国产一本一道久久香蕉| 国产精品素人视频| 欧美日韩在线大尺度| 欧美肥婆在线| 免费欧美日韩| 女同性一区二区三区人了人一| 久久久999成人| 欧美中文在线观看国产| 小黄鸭精品密入口导航| 亚洲一区国产视频| 亚洲一区二区三区精品在线| 国产精品99久久久久久久久| 一本色道久久综合狠狠躁篇的优点 | 久久人人看视频| 久久精品国产久精国产一老狼| 新狼窝色av性久久久久久| 亚洲综合色婷婷| 午夜精品美女久久久久av福利| 亚洲欧美日韩一区二区在线 | 欧美大片免费观看| 欧美激情一区二区三区蜜桃视频 | 欧美日韩大片一区二区三区| 欧美日韩一区二区三区在线| 国产精品av免费在线观看| 国产精品久久999| 国产精品区一区二区三区| 国产日产欧美a一级在线| 国产一区二区中文字幕免费看| 韩国一区电影| 在线视频成人| 日韩亚洲国产欧美| 一区二区三区四区五区精品| 亚洲女ⅴideoshd黑人| 香蕉久久夜色精品国产| 欧美在线啊v一区| 亚洲国产一区二区三区a毛片| 亚洲人成网站999久久久综合| 日韩亚洲欧美一区二区三区| 亚洲淫片在线视频| 欧美专区日韩专区| 欧美xart系列在线观看| 欧美日韩亚洲在线| 国产日韩欧美电影在线观看| 在线成人h网| 亚洲老板91色精品久久| 亚洲永久免费观看| 亚洲国产裸拍裸体视频在线观看乱了中文| 亚洲三级影院| 亚洲午夜在线观看视频在线| 久久精品国产在热久久| 欧美国产亚洲视频| 国产精品女主播| 伊人久久噜噜噜躁狠狠躁| 日韩一区二区福利| 亚洲欧美日韩视频二区| 亚洲欧洲偷拍精品| 亚洲欧美久久久| 久久伊人精品天天| 国产精品福利网站| 在线欧美影院| 亚洲专区一区| 亚洲精品之草原avav久久| 国产精品无人区| 国产精品国产三级欧美二区| 久久在线播放| 亚洲免费一在线| 午夜精品久久久久久久蜜桃app | 国产精品99一区二区| 欧美一区二区三区在线播放| 一区二区三区亚洲| 日韩一级精品| 国产欧美在线看| 99视频一区| 亚洲自拍另类| 国产精品亚洲不卡a| 日韩午夜精品视频| 国产亚洲欧美激情| 久久精品在线播放| 亚洲欧洲综合另类| 国产亚洲免费的视频看| 欧美一二三区精品| 亚洲一区二区三区免费在线观看| 国产综合网站| 亚洲视频一区在线观看| 亚洲一区高清| 国产精品盗摄久久久| 美日韩精品免费| 性欧美8khd高清极品| 国产精品一级在线| 久久精品久久99精品久久| 91久久香蕉国产日韩欧美9色| 一区精品在线| 猫咪成人在线观看| 亚洲国产成人在线播放| 亚洲精品免费在线播放| 国产精品欧美一区喷水| 亚洲欧美日韩视频一区| 久久国产福利| 亚洲精品在线一区二区| 日韩视频永久免费观看| 亚洲视频在线观看免费| 亚洲视频精选在线| 久久精品国产一区二区三区| 欧美日韩亚洲天堂| 亚洲国产高清一区二区三区| 欧美一区二区女人| 午夜亚洲伦理| 欧美三级中文字幕在线观看| 最新国产の精品合集bt伙计| 亚洲国产精品日韩| 久久久久久久91| 国产欧美日韩精品丝袜高跟鞋| 洋洋av久久久久久久一区| 99这里只有久久精品视频| 欧美刺激性大交免费视频| 韩国一区二区三区在线观看| 欧美亚洲免费电影| 欧美一区二区三区日韩| 国产精品久久久久久久久久久久久久 | 国产精品久久久对白| 日韩天堂在线观看| 日韩视频一区| 欧美成人综合| 最新成人在线| 日韩亚洲欧美一区二区三区| 欧美激情aaaa| 91久久在线视频| 日韩一级片网址| 欧美日韩国产不卡在线看| 亚洲精品视频在线看| 一本久久精品一区二区| 欧美日韩亚洲一区二| 一本久道久久综合婷婷鲸鱼| 亚洲一线二线三线久久久| 国产精品美腿一区在线看 | 性亚洲最疯狂xxxx高清| 久久久久**毛片大全| 精品成人一区二区三区| 最新成人av在线| 欧美激情国产日韩| 亚洲美女黄色片| 在线亚洲观看| 国产精品裸体一区二区三区| 性欧美长视频| 久久亚洲一区| 亚洲福利视频在线| 亚洲无限av看| 国产精品资源| 久久精品国产亚洲高清剧情介绍| 麻豆精品在线播放| 最新69国产成人精品视频免费| 亚洲深爱激情| 国产精品色婷婷| 欧美一区二区视频在线观看2020 | 午夜精品一区二区在线观看| 久久在线精品| 亚洲三级观看| 午夜精品久久久久久久白皮肤| 国产午夜精品美女视频明星a级 | 国产日韩视频| 最新国产精品拍自在线播放| 欧美日韩亚洲另类| 亚洲欧美中日韩| 欧美 日韩 国产精品免费观看| 亚洲免费福利视频| 欧美一区91| 亚洲高清精品中出| 亚洲欧美久久| 影音先锋在线一区| 亚洲一区二区三区四区五区黄 | 国产性猛交xxxx免费看久久| 91久久中文字幕| 国产精品夫妻自拍| 亚洲福利视频一区| 国产精品s色| 亚洲国产女人aaa毛片在线| 欧美视频中文在线看 | 亚洲高清久久久| 欧美三区在线观看| 久久精品123| 欧美三日本三级少妇三2023| 久久国产精品久久w女人spa| 欧美午夜宅男影院在线观看| 亚洲国产精品电影在线观看| 国产精品久久久久久亚洲毛片 | 国模精品娜娜一二三区| 一区二区av在线| 韩国福利一区| 亚洲一区美女视频在线观看免费| 激情综合中文娱乐网| 亚洲欧美日韩久久精品| 亚洲激情二区| 久久免费高清视频| 正在播放亚洲|