91麻豆精品,曰本一区二区三区视频,国产精品麻豆成人av电影艾秋

主頁 > 知識庫 > 幾道和「黑洞照片」那種海量數據有關的算法問題

幾道和「黑洞照片」那種海量數據有關的算法問題

昨晚被一則新聞刷屏：北京時間 4 月 10 日今晚 9 點，人類首張黑洞照片正式發布。

看到這張圖片，小吳心里是極為震撼的：愛因斯坦太太太太太牛逼了！！！

同時，看新聞的時候小吳還注意到里面有個細節，給黑洞”拍照“的事件視界望遠鏡從 2017 年就開始為黑洞拍照了，但直到 2019 年才公布。

心里不禁納悶：為什么給黑洞拍照需要這么長時間？

于是去更加詳細的搜索資料，果然發現了端倪，其中一個點就是望遠鏡觀測到的數據量非常龐大！

2017 年時 8 個望遠鏡的數據量達到了 10PB（=10240TB），2018 年又增加了格陵蘭島望遠鏡，數據量繼續增加。龐大的數據量為處理讓數據處理的難度不斷加大。

平時面試的時候老是說海量數據，海量數據，這次的數據真的是海量數據了。

這次的數據流之大，導致每個射電望遠鏡產生的數據，都只能用硬盤來儲存。

那么現在問題來了，假設你作為給黑洞拍照的研發人員，給你一臺內存有限的計算機，你如何找出這些數據的中位數或者判斷某個數字是否存在里面。

1. 海量數據查找中位數

題目描述

現在有 10 億個 int 型的數字（ java 中 int 型占 4B），以及一臺可用內存為 1GB 的機器，如何找出這 10 億個數字的中位數？

所謂中位數就是有序列表中間的數。如果列表長度是偶數，中位數則是中間兩個數的平均值。

題目解析

題目中有 10 億個數字，每個數字在內存中占 4B，那么這 10 億個數字完全加載到內存中需要：10 * 10^8 * 4，大概需要 4GB 的存儲空間。根據題目的限制，顯然不能把所有的數字都裝入內存中。

這里，可以采用基于二進制位比較和快速排序算法中的分割思想來尋找中位數，實際上這也是桶排序的一種應用。

桶排序

假設將這 10 億個數字保存在一個大文件中，依次讀一部分文件到內存(不超過內存的限制： 1GB )，將每個數字用二進制表示，比較二進制的最高位(第 32 位)，如果數字的最高位為 0，則將這個數字寫入 file_0 文件中；如果最高位為 1，則將該數字寫入 file_1 文件中。

注意：最高位為符號位，也就是說 file_1 中的數都是負數，而 file_0 中的數都是正數。

通過這樣的操作，這 10 億個數字分成了兩個文件，假設 file_0 文件中有 6 億個數字，而 file_1 文件中有 4 億個數字。

這樣劃分后，思考一下：所求的中位數在哪個文件中？

10 億個數字的中位數是10 億個數排序之后的第 5 億個數，現在 file_0 有 6 億個正數，file_1 有 4 億個負數，file_0 中的數都比 file_1 中的數要大，排序之后的第 5 億個數一定是正數，那么排序之后的第 5 億個數一定位于file_0中。

也就是說：中位數就在 file_0 文件中，并且是 file_0 文件中所有數字排序之后的第 1 億個數字。

現在，我們只需要處理 file_0 文件了（不需要再考慮 file_1 文件）。

而對于 file_0 文件，可以同樣的采取上面的措施處理：將 file_0 文件依次讀一部分到內存(不超內存限制：1GB )，將每個數字用二進制表示，比較二進制的次高位（第 31 位），如果數字的次高位為 0，寫入 file_0_0 文件中；如果次高位為 1 ，寫入 file_0_1 文件中。

現假設 file_0_0 文件中有 3 億個數字，file_0_1中也有 3 億個數字，則中位數就是：file_0_0 文件中的數字從小到大排序之后的第 1 億個數字。

拋棄 file_0_1 文件，繼續對 file_0_0 文件根據次次高位(第 30 位) 劃分，假設此次劃分的兩個文件為：file_0_0_0中有 0.5 億個數字，file_0_0_1 中有 2.5 億個數字，那么中位數就是 file_0_0_1 文件中的所有數字排序之后的第 0.5 億個數。

2. 海量數據中判斷數字是否存在

題目描述

現在有 10 億個 int 型的數字（ java 中 int 型占 4B），以及一臺可用內存為 1GB 的機器，給出一個整數，問如果快速地判斷這個整數是否在這 10 億數字中？

題目分析

這里可以使用布隆過濾器進行處理。

布隆過濾器（英語：Bloom Filter）是 1970 年由 Burton Bloom 提出的。

它實際上是一個很長的二進制矢量和一系列隨機映射函數。

它可以用來判斷一個元素是否在一個集合中。它的優勢是只需要占用很小的內存空間以及有著高效的查詢效率。

對于布隆過濾器而言，它的本質是一個位數組：位數組就是數組的每個元素都只占用 1 bit ，并且每個元素只能是 0 或者 1。

一開始，布隆過濾器的位數組所有位都初始化為 0。比如，數組長度為 m ，那么將長度為 m 個位數組的所有的位都初始化為 0。

0	0	0	0	0	0	0	0	0	0
0	0	1	。	。	。	。	。	m-2	m-1

在數組中的每一位都是二進制位。

布隆過濾器除了一個位數組，還有 K 個哈希函數。當一個元素加入布隆過濾器中的時候，會進行如下操作：

使用 K 個哈希函數對元素值進行 K 次計算，得到 K 個哈希值。根據得到的哈希值，在位數組中把對應下標的值置為 1。

圖 1

舉個例子，假設布隆過濾器有 3 個哈希函數：f1, f2, f3 和一個位數組 arr。現在要把 2333 插入布隆過濾器中：

對值進行三次哈希計算，得到三個值 n1, n2, n3。把位數組中三個元素 arr[n1], arr[n2], arr[3] 都置為 1。

當要判斷一個值是否在布隆過濾器中，對元素進行三次哈希計算，得到值之后判斷位數組中的每個元素是否都為 1，如果值都為 1，那么說明這個值在布隆過濾器中，如果存在一個值不為 1，說明該元素不在布隆過濾器中。

布隆

總結

以上所述是小編給大家介紹的幾道和「黑洞照片」那種海量數據有關的算法問題，希望對大家有所幫助，如果大家有任何疑問請給我留言，小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持！
如果你覺得本文對你有幫助，歡迎轉載，煩請注明出處，謝謝！

您可能感興趣的文章:

Python數據結構與算法之圖的最短路徑(Dijkstra算法)完整實例
JS實現的數組去除重復數據算法小結
Python數據結構與算法之圖結構（Graph）實例分析
C++數據結構與算法之雙緩存隊列實現方法詳解

標簽：文山南昌鹽城黔南桂林宣城東莞景德鎮

巨人網絡通訊聲明：本文標題《幾道和「黑洞照片」那種海量數據有關的算法問題》，本文關鍵詞幾道,和,黑洞,照片,那種,；如發現本文內容存在版權問題，煩請提供相關信息告之我們，我們將及時溝通與處理。本站內容系統采集于網絡，涉及言論、版權與本站無關。

下面列出與本文章《幾道和「黑洞照片」那種海量數據有關的算法問題》相關的同類信息！

幾道和「黑洞照片」那種海量數據有關的算法問題

昨晚被一則新聞刷屏：北京時間 4 月 10 日今晚 9 點，人類首張黑洞照片正式發布。看到這張圖片，小吳心里是極為震撼的：愛因斯坦太太太太太牛逼了！！！同時，看新聞的時候小吳...

10-18

如何留住網站訪問者？什么樣的網站才有未來？

現如今大到網站，小到媒體平臺，大家都在考慮如何留住訪問者這個問題，因為做到這點，我們才能獲得長足的發展，可以說...

10-19

阿里云盒子OS系統全面升級，終于不怕刪軟件了！

近期很多使用阿里云系統電視盒子的用戶都發現盒子系統都收到了系統升級的提示，其中包孕，，天敏、開博爾、憶典、靈云...

10-16

華勝天成聯絡中心咨詢服務解決方案（1）

概述北京華勝天成科技股份有限公司集合了一批具有多年呼叫中心建設與運營管理經驗的專家，組成了咨詢團隊；同時借助...

10-22

臺州餐飲加盟群呼線路服務商,外呼線路服務商-信譽保證

臺州餐飲加盟群呼線路服務商,外呼線路服務商針對這個問題，系統的解決方法是，在系統收取聲響后。先對原始信號進行處...

12-17

企業名稱的作用

1.特指個體的稱呼企業名稱是企業參加民事活動時的稱呼。企業參與民事活動，出現在書面上，是一個文字形式的標記;出現...

10-23

南京不標記雙向回撥線路收費-看這里！

南京不標記雙向回撥線路收費為、財稅等企業客戶提供電話銷售客服功能，在降低人工成本的同時，提高了電話外呼次數。智...

01-16

無錫電銷機器人廠家

匯港通科技組裝于2018年，是一家潛心于大中小企業精準經營銷售和企業管理效勞處置計劃的供給商。“構造框架結構扁平化...

10-31

海北州電話機器人（西寧電話機器人）

本文目錄一覽：1、智能語音機器人是不是就是打電話的?2、電話智能機器人值得使用嗎?五個具體操作步驟分享3、人工智能電...

07-19

公司申請400電話都有哪些環節呢

很多公司在申請400電話時，感覺流程復雜，辦理起來很麻煩，那是因為對400電話申請沒有一個整體的了解，實際上在了解40...

05-09

濟南crm外呼系統哪家好（濟南crm外呼系統哪家好用）

本文目錄一覽： 1、哪些電話電話外呼系統比較好，功能完善呢？2、網絡電話外呼系統哪個好？3、有知道的么外呼系統哪家...

11-27

Optus加深了思科與新Webex呼叫中心的聯系

老秦夜譯 CTI論壇(ctiforum.com)6月1日消息（編譯/老秦）:Optus已啟動區域性Webex聯絡中心以支持其Cisco產品。該產品可容納20，0...

10-19

專利保護的意義

專利制度通過給發明創造者以發明創造專利權和排他獨占權，使專利權人在一定時期內獨家占領市場，這不僅能使其收回研究...

10-23

天津財稅電話銷售線路辦理商家,群呼系統-注意!

天津財稅電話銷售線路辦理商家,群呼系統電話營銷外呼系統有什么特點?電話營銷外呼系統座席電話能夠隨意設定，正確引導...

12-17

珠海crm外呼系統廠家（珠海crm外呼系統廠家排名）

今天給各位分享珠海crm外呼系統廠家的知識，其中也會對珠海crm外呼系統廠家排名進行解釋，如果能碰巧解決你現在面臨的問...

05-16

如何在騰訊地圖上標記地點？如何在騰訊地圖上標記多個地點？

如何在地圖上標記多個地點？多企業為了直觀的了解市場動態進行數據可視化的方法，但是現在很多工作人員對于在地圖上...

10-08

哈爾濱申請400電話條件（黑龍江400電話申請）

【哈爾濱申請400電話條件】哈爾濱400電話的市場權威性已經得到肯定，因此很多企業愿意為了消費者的信任度而將哈爾濱...

11-07

青島語音電銷機器人線路（電銷機器人電話機器人）

今天給各位分享青島語音電銷機器人線路的知識，其中也會對電銷機器人電話機器人進行解釋，如果能碰巧解決你現在面臨的...

02-06

企業電銷外呼系統（電銷外呼軟件代理）

本文目次一覽： 1、電銷企業為什么需求德律風外呼零碎？該怎樣去抉擇？ 2、電銷外呼零碎幾何錢一個月？ 3、電銷客外呼零...

11-25

記錄集內隨機取記錄的代碼

% ' Moving to random record - Steven Jones' Extension If Not(記錄集名稱.bof and 記錄集名稱.eof) Then ' reset the cursor to the beginning If (記錄集名...

10-18

VMware 虛擬機(linux)增加根目錄磁盤空間的方法

一、關閉你的虛擬機系統，找到如下內容：選擇Edit Virtual mache settings 點擊Expand 擴大虛擬機的空間為40G(根據個人需要填寫空間...

10-20

天津聯通呼叫中心軟件辦理價格,電銷機器人辦理-優質服務

天津聯通呼叫中心軟件辦理價格,電銷機器人辦理3.話術錄音方式(是否支持自定義音色音量或上傳實時錄音)。4.自定義變量拼...

12-17

尷尬！FB聲稱的美國廣告受眾竟比人口普查數據還高

騰訊科技訊據外媒報道，一位投資分析師周三體現，Facebook向廣告主聲稱的潛在受眾數據與美國的人口普查數據存在出入，這...

10-16

長沙自動電銷機器人線路（長沙智能電銷機器人）

本篇文章給咱們談談長沙主動電銷機器人線路，以及長沙智能電銷機器人對應的常識點，期望對各位有所協助，不要忘了保藏...

05-18

外呼系統運營商（網絡電話外呼系統排名）

今天給各位分享外呼系統運營商的知識，其中也會對網絡電話外呼系統排名進行解釋，如果能碰巧解決你現在面臨的問題，別...

02-22

一份Mac OS 圖形界面發展簡史：從荒蠻走向現代

火星文：Mac OS 是運行在蘋果電腦上的操作系統，它是第一個在商用領域取得成功的圖形用戶界面，下面這個讓我們一覽從 ...

10-20

如何進行客戶管理？

在銷售行業來說，你或許會經常聽到“開發十個新客戶，不如維護好一個老客戶”這樣一句話。雖然說這句話有點夸大，但是...

12-18

常州防封電話營銷線路哪里有,電話系統-服務周到!

常州防封電話營銷線路哪里有,電話系統提高人工客服的時間利用率。信息收集：電銷機器人在跟客戶的初步溝通中，可以自...

12-17

長春人工外呼系統有效果嗎（長春外呼系統加盟）

本篇文章給我們談談長春人工外呼體系有作用嗎，以及長春外呼體系加盟對應的知識點，希望對各位有所協助，不要忘了保藏...

05-17

市場擴張,品牌的永恒話題

市場擴張,就像是商業戰場上的“政城掠地”,企業總是希望通過擴張市場版圖,來建立龐大的品牌王國。而關于市場擴張的報道...

10-23

呼叫中心解決方案及服務提供商合力億捷上半年營收7952萬 --凈利1371萬

8月9日，合力億捷(833629)披露2018年半年報，公司2018上半年實現營收7952.34萬元，同比增長15.33%；歸母凈利潤為1370.78萬元，同比...

10-19

電銷卡從哪購買（電銷卡在哪里購買）

本文目錄一覽：1、海口電銷手機卡哪里買2、成都電銷卡去哪里購買3、電銷卡在哪里辦理4、哪里有已實名電銷卡購買平臺5、...

07-10

Access 導入到SQL Server 2005的方法小結

方法一: 名稱：DTS（這個在MSSQL2000里邊也有）操作：在命令提示符窗口中運行 DTSWizard.exe SQL Server 導入和導出向導提供了生成...

10-18

力保信息安全大好大財務部鎖定外包郵

在黑客橫行、木馬泛濫的今天，電子信息的安全比任何時候都顯得重要，無論是企業商務還是個人私密，都存在著不可預知的...

10-22

企業400電話申請有什么好處

假如你沒有過創業，也許不會感覺到400電話申請為企業帶來的好處，但作為消費者，對400電話是否有種無言的信賴，感覺擁有...

05-09

石家莊銷售智能電話機器人（石家莊銷售智能電話機器人公司）

本文目次一覽： 1、人工智能德律風營銷呆板人終究能做什么？ 2、ai智能德律風發售呆板人哪家的靠譜？ 3、智能德律風發售...

11-25

文山電話機器人廠家電話銷售系統匯港通科技

匯港通科技團隊組建于2018年，是一家專注于中小企業精準營銷和企業管理服務解決方案的提供商。匯港通自主研發基于大數...

10-31

技術創新促進服務提升-訪威瑞特公司亞太區副總裁NigelHewett

Nigel Hewett檔案：Nigel Hewett是Verint公司亞洲地區副總裁。他主要負責整個亞太地區與Witness Actionable Solutions 的業務運作，具體負...

10-22

臺山電話機器人（電話機器人多少錢?）

本文目錄一覽：1、想請問一下智能語音機器人一天可以打多少電話?2、電銷機器人一般多少錢?3、有誰用過電銷機器人?效果怎...

07-15

科大訊飛電話機器人使用（科大訊飛語音機器人）

本文目錄一覽： 1、那么多電話機器人,我們怎么測試誰家的好？2、電話機器人效果怎么樣_好不好用？3、什么是AI智能電話機...

11-27

重慶高頻外呼系統怎么安裝（高頻外呼防封系統）

今天給各位分享重慶高頻外呼系統怎么安裝的知識，其中也會對高頻外呼防封系統進行解釋，如果能碰巧解決你現在面臨的問...

05-16

網站優化中搜索框如何設計?網站建設搜索框設計技巧和功能

網站建設包括很多重要內容：導航設計，整體布局，搜索功能設計和底部設計再加上網頁設計。網站設計美觀在整體設計在用...

10-19

易到今日14時起車主可通過APP提現可“秒到賬”

騰訊科技訊6 月 30 日，易到今日通過官方公眾號頒布頒發，今日 14 時起，所有易到平臺車主均可通過車主端APP完成提現。據...

10-16

上海智能電銷機器人怎么樣（上海智能電銷機器人怎么樣知乎）

本文目錄一覽： 1、有誰用過電銷板滯人？成就怎樣樣？ 2、電銷板滯人怎樣樣 3、電銷板滯人成就怎樣樣必修必修必修 4、電...

11-26

南寧語音電銷機器人供應商（南寧少兒機器人）

本篇文章給大家談談南寧語音電銷機器人供應商，以及南寧少兒機器人對應的知識點，希望對各位有所幫助，不要忘了收藏本...

04-07

鄭州將申建國家服務外包示范城

本報訊（記者李娜實習生李玲張雅靜）記者昨日獲悉，省政府印發了《關于加快轉變外貿發展方式促進對外貿易跨越式發展...

10-22

呼叫中心如何從電子商務時代獲利？

民航資源網2014年6月6日消息：電子商務飛速發展是否真讓傳統的呼叫中心無所適從呢？網絡和移動平臺機器客服是否會真能...

10-20

使用SQL查詢DB2 9中的XML數據

正在看的db2教程是:使用SQL查詢DB2 9中的XML數據。雖然 DB2 的混合體系結構與之前的版本有很大的不同，但是要利用它的新 X...

10-18

融營通信電話銷售外呼軟件（融營通信電話銷售外呼軟件怎么樣）

本篇文章給大家談談融營通信電話銷售外呼軟件，以及融營通信電話銷售外呼軟件怎么樣對應的知識點，希望對各位有所幫助...

08-28

濟源打電話機器人（濟源打電話機器人怎么收費）

本文目錄一覽： 1、濟源年代機器人科技有限公司怎樣樣？2、電話機器人多少錢？貴嘛？3、電話機器人價格是多少，值嗎？...

11-28

漯河百應外呼系統聯系方式的簡單介紹

本篇文章給大家談談漯河百應外呼系統聯系方式，以及對應的知識點，希望對各位有所幫助，不要忘了收藏本站喔。本文目...

11-06

幾道和「黑洞照片」那種海量數據有關的算法問題

10-18

本頁收集關于幾道和「黑洞照片」那種海量數據有關的算法問題的相關信息資訊供網民參考！

推薦文章

上一篇：都2019年了，還問http中GET和POST的區別

下一篇：GitHub 熱門：別再用 print 輸出來調試代碼了

一起分享吧

婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

幾道和「黑洞照片」那種海量數據有關的算法問題