伴隨著氣象技術(shù)的發(fā)展以及城市氣象設(shè)施的完善,氣象監(jiān)測(cè)服務(wù)能力在不斷提高,實(shí)現(xiàn)短期甚至中長(zhǎng)期的氣象預(yù)測(cè)成為可能。
短期、長(zhǎng)期的天氣形勢(shì)預(yù)測(cè),不僅能幫助相關(guān)行業(yè)、有關(guān)部門針對(duì)性地進(jìn)行極端天氣防范準(zhǔn)備,降低氣象災(zāi)害帶來(lái)的影響;還可以提升對(duì)風(fēng)力、水力等可再生能源的利用效率,實(shí)現(xiàn)可持續(xù)發(fā)展,推動(dòng)環(huán)境保護(hù)。
而大地量子正是這樣一家深耕氣象領(lǐng)域的公司。作為定位為AI大模型與數(shù)字孿生的公司,大地量子通過(guò)對(duì)PB級(jí)衛(wèi)星遙感數(shù)據(jù)、氣象數(shù)據(jù)的AI開發(fā),打造業(yè)界領(lǐng)先的天氣預(yù)測(cè)、清潔能源功率預(yù)測(cè)、綠電交易預(yù)測(cè)、碳匯碳排等技術(shù)產(chǎn)品,并利用自有的AI與超算優(yōu)勢(shì),完成下一代氣象預(yù)報(bào)系統(tǒng)。
(相關(guān)資料圖)
預(yù)測(cè)一個(gè)地理位置的氣象情況,實(shí)際是根據(jù)周圍的觀測(cè)站點(diǎn)的大量信息,做重合面積的地理信息查詢,包括經(jīng)緯度、溫度、濕度等具體數(shù)值。除此之外,大自然中變幻莫測(cè)的風(fēng)、雨、云、電,也會(huì)為數(shù)據(jù)的計(jì)算能力和實(shí)時(shí)查詢也帶來(lái)了巨大的難點(diǎn)。具體可以包括以下三點(diǎn):
第一,地理信息數(shù)據(jù)處理能力,業(yè)務(wù)需要豐富的geo函數(shù),用于整合海量的歷史氣象數(shù)據(jù),對(duì)目標(biāo)點(diǎn)位/區(qū)域?qū)崿F(xiàn)天氣預(yù)測(cè);第二,高時(shí)效性查詢需求,風(fēng)場(chǎng)、云層預(yù)測(cè)等模型需要實(shí)時(shí)查詢能力,快速做到結(jié)果反饋;第三,由于查詢的接口眾多,高并發(fā)擴(kuò)展也是交互式業(yè)務(wù)不可或缺的能力之一。
如何解決這些痛點(diǎn)?大地量子選擇了與火山引擎云原生數(shù)據(jù)倉(cāng)庫(kù)ByteHouse進(jìn)行合作。
隨著字節(jié)跳動(dòng)業(yè)務(wù)的快速發(fā)展,產(chǎn)生了海量的產(chǎn)品使用數(shù)據(jù)分析需求。這類場(chǎng)景數(shù)據(jù)指標(biāo)計(jì)算相對(duì)復(fù)雜、數(shù)據(jù)總量大且查詢模式多變,要求底層數(shù)據(jù)計(jì)算引擎具備高可用性,以及具備應(yīng)對(duì)超大數(shù)據(jù)規(guī)模下交互式實(shí)時(shí)響應(yīng)的能力。ByteHouse的極致性能和強(qiáng)大計(jì)算能力,正是源于內(nèi)部場(chǎng)景的多年積累和檢驗(yàn)。
在字節(jié)跳動(dòng)內(nèi)部實(shí)踐場(chǎng)景和海量數(shù)據(jù)打磨下的技術(shù)能力也復(fù)制在大地量子上,并進(jìn)行了進(jìn)一步升級(jí)。
據(jù)介紹,ByteHouse起初是基于開源ClickHouse引擎進(jìn)行技術(shù)架構(gòu)重構(gòu)和優(yōu)化。但相比起原生的ClickHouse,火山引擎ByteHouse基于獨(dú)家自研的高可用引擎及查詢優(yōu)化器,可以為企業(yè)提供快速、穩(wěn)定、安全的查詢服務(wù)和數(shù)據(jù)寫入性能。
從技術(shù)層面看,ByteHouse 提供了 PB 級(jí)數(shù)據(jù)秒級(jí)響應(yīng),通過(guò)增強(qiáng)的自研引擎,確保95%以上的查詢均可在秒級(jí)返回,同時(shí)通過(guò)自研的HAEngine和元數(shù)據(jù)持久化等優(yōu)化,ByteHouse提供了新的生產(chǎn)級(jí)高可用方案,能夠保障其在大數(shù)據(jù)量場(chǎng)景下依然不會(huì)影響到查詢分析體驗(yàn)。
大地量子通過(guò)將現(xiàn)場(chǎng)采集及大模型生成的氣象數(shù)據(jù)導(dǎo)入到ByteHouse中,通過(guò)ByteHouse的多邊形計(jì)算、方差、平均值等計(jì)算函數(shù)能力,支撐GEO查詢和空間計(jì)算,滿足其對(duì)預(yù)測(cè)系統(tǒng)以及交互式查詢需求。另外,針對(duì)大地量子不同階段數(shù)據(jù)波動(dòng)情況,ByteHouse也提出了定制化解決方案。例如,在業(yè)務(wù)數(shù)據(jù)低谷期,ByteHouse提供集群節(jié)點(diǎn)進(jìn)行自助升級(jí)能力,在保持產(chǎn)品功能更新的同時(shí),能更靈活幫助大地量子控制產(chǎn)品版本,降低運(yùn)維負(fù)擔(dān)。
在降本增效層面,大地量子也利用ByteHouse進(jìn)行了極致優(yōu)化。ByteHouse 能支持用戶自定義冷存儲(chǔ)的比例,該能力幫助大地量子將查詢頻次較少的歷史數(shù)據(jù)進(jìn)行冷存,起到降低存儲(chǔ)成本的作用,最終實(shí)現(xiàn)查詢效率和成本之間的平衡。
目前,在業(yè)務(wù)實(shí)踐中,平均查詢?nèi)蝿?wù)時(shí)長(zhǎng)始終保持在50毫秒以內(nèi),同時(shí)可以做到400QPS的峰值并發(fā),火山引擎ByteHouse的高效率表現(xiàn)為大地量子提供了最有力的用數(shù)支持。
未來(lái),大地量子將把部分功能作為API接口對(duì)外開放,ByteHouse的高查詢性能足以滿足預(yù)測(cè)系統(tǒng)及后續(xù)交互式查詢需求,進(jìn)一步為大地量子提供了查詢并發(fā)的保障,為業(yè)務(wù)擴(kuò)展提供基礎(chǔ)。除此之外,由于ByteHouse 支持無(wú)損和自助水平擴(kuò)容,隨著數(shù)據(jù)量持續(xù)增加,大地量子也計(jì)劃通過(guò) ByteHouse 集群的水平擴(kuò)容來(lái)動(dòng)態(tài)調(diào)整和支持計(jì)算、存儲(chǔ)能力,為高性能查詢提供更強(qiáng)保障。
除了在氣象領(lǐng)域落地,火山引擎ByteHouse還與中國(guó)地震臺(tái)網(wǎng)中心、海王集團(tuán)、莉莉絲游戲、極客邦科技等諸多行業(yè)企業(yè)達(dá)成了深度合作,憑借新一代的云原生架構(gòu),高效方便的運(yùn)維模式,以及高性能更靈活的實(shí)時(shí)查詢能力,為企業(yè)抓穩(wěn)數(shù)字化機(jī)遇建立了夯實(shí)的地基,推動(dòng)企業(yè)的數(shù)智化轉(zhuǎn)型升級(jí)。(作者:李維)