• <rt id="2wkqu"><small id="2wkqu"></small></rt>
  • 您當(dāng)前的位置 :環(huán)球傳媒網(wǎng)>前瞻 > 正文
    保姆級(jí) Prometheus PromQL 講解與實(shí)戰(zhàn)操作
    2023-03-25 22:22:02 來(lái)源:騰訊云 編輯:

    一、PromQL 介紹

    PromQL(Prometheus Query Language)為 Prometheus tsdb 的查詢語(yǔ)言。是結(jié)合 grafana 進(jìn)行數(shù)據(jù)展示和告警規(guī)則的配置的關(guān)鍵部分。


    (相關(guān)資料圖)

    官方文檔:https://prometheus.io/docs/prometheus/latest/querying/basics/

    二、四種指標(biāo)類型

    counter(計(jì)數(shù)器)gauge (儀表類型)histogram(直方圖類型)summary (摘要類型)

    1)counter(計(jì)數(shù)器)

    Counter(只增不減的計(jì)數(shù)器) 類型的指標(biāo)其工作方式和計(jì)數(shù)器一樣,只增不減。常見(jiàn)的監(jiān)控指標(biāo),如 http_requests_total、 node_cpu_seconds_total都是 Counter類型的監(jiān)控指標(biāo)。

    在 node-exporter 返回的樣本數(shù)據(jù)中,其注釋中也包含了該樣本的類型。例如:

    # HELP node_cpu_seconds_total Seconds the cpus spent in each mode.# TYPE node_cpu_seconds_total counternode_cpu_seconds_total{cpu="cpu0",mode="idle"} 362812.7890625
    #HELP:解釋當(dāng)前指標(biāo)的含義,上面表示在每種模式下 node 節(jié)點(diǎn)的 cpu 花費(fèi)的時(shí)間,以 s 為單位。#TYPE:說(shuō)明當(dāng)前指標(biāo)的數(shù)據(jù)類型,上面是 counter 類型。

    counter是一個(gè)簡(jiǎn)單但又強(qiáng)大的工具,例如我們可以在應(yīng)用程序中記錄某些事件發(fā)生的次數(shù),通過(guò)以時(shí)間序列的形式存儲(chǔ)這些數(shù)據(jù),我們可以輕松的了解該事件產(chǎn)生的速率變化。PromQL內(nèi)置的聚合操作和函數(shù)可以讓用戶對(duì)這些數(shù)據(jù)進(jìn)行進(jìn)一步的分析,例如,通過(guò) rate()函數(shù)獲取 HTTP 請(qǐng)求量的增長(zhǎng)率:

    rate(http_requests_total[5m])

    查詢當(dāng)前系統(tǒng)中,訪問(wèn)量前 10 的 HTTP 請(qǐng)求:

    topk(10, http_requests_total)

    2)gauge (儀表類型)

    Counter不同, Gauge(可增可減的儀表盤)類型的指標(biāo)側(cè)重于反應(yīng)系統(tǒng)的當(dāng)前狀態(tài)。因此這類指標(biāo)的樣本數(shù)據(jù)可增可減。常見(jiàn)指標(biāo)如:node_memory_MemFree_bytes(主機(jī)當(dāng)前空閑的內(nèi)存大小)、 node_memory_MemAvailable_bytes(可用內(nèi)存大小)都是 Gauge類型的監(jiān)控指標(biāo)。通過(guò) Gauge指標(biāo),用戶可以直接查看系統(tǒng)的當(dāng)前狀態(tài):

    node_memory_MemFree_bytes

    對(duì)于 Gauge類型的監(jiān)控指標(biāo),通過(guò) PromQL內(nèi)置函數(shù) delta()可以獲取樣本在一段時(shí)間范圍內(nèi)的變化情況。例如,計(jì)算 CPU 溫度在兩個(gè)小時(shí)內(nèi)的差異:

    delta(cpu_temp_celsius{host="zeus"}[2h])

    還可以直接使用 predict_linear()對(duì)數(shù)據(jù)的變化趨勢(shì)進(jìn)行預(yù)測(cè)。例如,預(yù)測(cè)系統(tǒng)磁盤空間在 4 個(gè)小時(shí)之后的剩余情況:

    predict_linear(node_filesystem_free_bytes[1h], 4 * 3600)

    3)Histogram(直方圖類型) 和 Summary(摘要類型)

    除了 CounterGauge類型的監(jiān)控指標(biāo)以外,Prometheus 還定義了 HistogramSummary的指標(biāo)類型。HistogramSummary主用用于統(tǒng)計(jì)和分析樣本的分布情況。

    在大多數(shù)情況下人們都傾向于使用某些量化指標(biāo)的平均值,例如 CPU 的平均使用率、頁(yè)面的平均響應(yīng)時(shí)間,這種方式也有很明顯的問(wèn)題,以系統(tǒng) API 調(diào)用的平均響應(yīng)時(shí)間為例:如果大多數(shù) API 請(qǐng)求都維持在 100ms 的響應(yīng)時(shí)間范圍內(nèi),而個(gè)別請(qǐng)求的響應(yīng)時(shí)間需要 5s,那么就會(huì)導(dǎo)致某些 WEB 頁(yè)面的響應(yīng)時(shí)間落到中位數(shù)上,而這種現(xiàn)象被稱為長(zhǎng)尾問(wèn)題。為了區(qū)分是平均的慢還是長(zhǎng)尾的慢,最簡(jiǎn)單的方式就是按照請(qǐng)求延遲的范圍進(jìn)行分組。例如,統(tǒng)計(jì)延遲在 0~10ms 之間的請(qǐng)求數(shù)有多少而 10~20ms 之間的請(qǐng)求數(shù)又有多少。通過(guò)這種方式可以快速分析系統(tǒng)慢的原因。HistogramSummary都是為了能夠解決這樣的問(wèn)題存在的,通過(guò) HistogramSummary類型的監(jiān)控指標(biāo),我們可以快速了解監(jiān)控樣本的分布情況。

    例如,指標(biāo) prometheus_tsdb_wal_fsync_duration_seconds的指標(biāo)類型為 Summary。它記錄了 Prometheus Server 中 wal_fsync的處理時(shí)間,通過(guò)訪問(wèn) Prometheus Server 的 /metrics地址,可以獲取到以下監(jiān)控樣本數(shù)據(jù):

    # HELP prometheus_tsdb_wal_fsync_duration_seconds Duration of WAL fsync.# TYPE prometheus_tsdb_wal_fsync_duration_seconds summaryprometheus_tsdb_wal_fsync_duration_seconds{quantile="0.5"} 0.012352463prometheus_tsdb_wal_fsync_duration_seconds{quantile="0.9"} 0.014458005prometheus_tsdb_wal_fsync_duration_seconds{quantile="0.99"} 0.017316173prometheus_tsdb_wal_fsync_duration_seconds_sum 2.888716127000002prometheus_tsdb_wal_fsync_duration_seconds_count 216

    從上面的樣本中可以得知當(dāng)前 Prometheus Server 進(jìn)行 wal_fsync操作的總次數(shù)為 216 次,耗時(shí) 2.888716127000002s。其中中位數(shù)(quantile=0.5)的耗時(shí)為 0.012352463,9 分位數(shù)(quantile=0.9)的耗時(shí)為 0.014458005s。

    在 Prometheus Server 自身返回的樣本數(shù)據(jù)中,我們還能找到類型為 Histogram 的監(jiān)控指標(biāo) prometheus_tsdb_compaction_chunk_range_seconds_bucket

    # HELP prometheus_tsdb_compaction_chunk_range_seconds Final time range of chunks on their first compaction# TYPE prometheus_tsdb_compaction_chunk_range_seconds histogramprometheus_tsdb_compaction_chunk_range_seconds_bucket{le="100"} 71prometheus_tsdb_compaction_chunk_range_seconds_bucket{le="400"} 71prometheus_tsdb_compaction_chunk_range_seconds_bucket{le="1600"} 71prometheus_tsdb_compaction_chunk_range_seconds_bucket{le="6400"} 71prometheus_tsdb_compaction_chunk_range_seconds_bucket{le="25600"} 405prometheus_tsdb_compaction_chunk_range_seconds_bucket{le="102400"} 25690prometheus_tsdb_compaction_chunk_range_seconds_bucket{le="409600"} 71863prometheus_tsdb_compaction_chunk_range_seconds_bucket{le="1.6384e+06"} 115928prometheus_tsdb_compaction_chunk_range_seconds_bucket{le="6.5536e+06"} 2.5687892e+07prometheus_tsdb_compaction_chunk_range_seconds_bucket{le="2.62144e+07"} 2.5687896e+07prometheus_tsdb_compaction_chunk_range_seconds_bucket{le="+Inf"} 2.5687896e+07prometheus_tsdb_compaction_chunk_range_seconds_sum 4.7728699529576e+13prometheus_tsdb_compaction_chunk_range_seconds_count 2.5687896e+07

    Summary類型的指標(biāo)相似之處在于 Histogram類型的樣本同樣會(huì)反應(yīng)當(dāng)前指標(biāo)的記錄的總數(shù)(以 _count作為后綴)以及其值的總量(以 _sum作為后綴)。不同在于 Histogram指標(biāo)直接反應(yīng)了在不同區(qū)間內(nèi)樣本的個(gè)數(shù),區(qū)間通過(guò)標(biāo)簽 le 進(jìn)行定義。

    三、表達(dá)式四種數(shù)據(jù)類型

    PromQL 查詢語(yǔ)句即表達(dá)式,實(shí)現(xiàn)的四種數(shù)據(jù)類型:

    瞬時(shí)向量(Instant vector):一組時(shí)間序列,每個(gè)時(shí)間序列包含單個(gè)樣本,它們共享相同的時(shí)間戳。也就是說(shuō),表達(dá)式的返回值中只會(huì)包含該時(shí)間序列中最新的一個(gè)樣本值。區(qū)間向量(Range vector):一組時(shí)間序列,每個(gè)時(shí)間序列包含一段時(shí)間范圍內(nèi)的樣本數(shù)據(jù)。標(biāo)量(Scalar):一個(gè)浮點(diǎn)型的數(shù)據(jù)值,沒(méi)有時(shí)序??梢詫懗蒣-](digits)[.(digits)]的形式。需要注意的是,使用表達(dá)式 count(http_requests_total)返回的數(shù)據(jù)類型依然是瞬時(shí)向量,用戶可以通過(guò)內(nèi)置函數(shù) scalar()將單個(gè)瞬時(shí)向量轉(zhuǎn)換為標(biāo)量。字符串(String):一個(gè)簡(jiǎn)單的字符串值。字符串可以用單引號(hào)("")、雙引號(hào)("")或反引號(hào)(``)來(lái)指定。

    1)瞬時(shí)向量(Instant vector)

    Instance vector(瞬時(shí)向量)表示一個(gè)時(shí)間序列的集合,但是每個(gè)時(shí)序只有最近的一個(gè)點(diǎn),而不是線。

    2)區(qū)間向量(Range vector)

    Range vector(范圍向量)表示一段時(shí)間范圍里的時(shí)序,每個(gè)時(shí)序可包含多個(gè)點(diǎn) 。

    3)標(biāo)量(Scalar)

    Scalar(標(biāo)量)通常為數(shù)值,可以將只有一個(gè)時(shí)序的 Instance vector 轉(zhuǎn)換成 Scalar。

    4) 字符串(String)

    一個(gè)簡(jiǎn)單的字符串值。字符串可以用單引號(hào)("")、雙引號(hào)("")或反引號(hào)(``)來(lái)指定。

    四、時(shí)間序列(向量)

    按照時(shí)間順序記錄系統(tǒng)、設(shè)備狀態(tài)變化的數(shù)據(jù),每個(gè)數(shù)據(jù)成為一個(gè)樣本。

    數(shù)據(jù)采集以特定的時(shí)間周期進(jìn)行,因而,隨著時(shí)間流逝,將這些樣本數(shù)據(jù)記錄下來(lái),將生成一個(gè)離散的樣本數(shù)據(jù)序列。該序列也稱為向量(Vector),以時(shí)間軸為橫坐標(biāo)、序列為縱坐標(biāo),這些數(shù)據(jù)點(diǎn)連接起來(lái)就會(huì)形成一個(gè)矩陣。

    1)時(shí)間序列的構(gòu)成

    每條時(shí)間序列(Time Series)是通過(guò)指標(biāo)名稱(Metrics name)和一組標(biāo)簽集(Label set)來(lái)命名的。

    如果 time 相同,但是指標(biāo)名稱或者標(biāo)簽集不同,那么時(shí)間序列也不同。

    2)樣本構(gòu)成

    矩陣中每一個(gè)點(diǎn)都可稱為一個(gè)樣本(Sample),樣本主要由 3 方面構(gòu)成。

    指標(biāo)(Metrics):包括指標(biāo)名稱(Metrics name)和一組標(biāo)簽集(Label set)名稱,如 request_total{path="/status",method="GET"}。時(shí)間戳(TimeStamp):這個(gè)值默認(rèn)精確到毫秒。樣本值(Value):這個(gè)值默認(rèn)使用 Float64 浮點(diǎn)類型。

    時(shí)間序列的指標(biāo)(Metrics)存儲(chǔ)格式為 key-value。

    http_request_total{status="200",method="GET"}@1434417560938=>94355為例,在 Key-Value 關(guān)系中,94355 作為 Value(也就是樣本值 Sample Value),前面的 http_request_total{status="200",method="GET"}@1434417560938一律作為 Key。

    3)key 的組成

    Metric Name:指標(biāo)名(例子中的 http_request_total)Label:標(biāo)簽(例子中的{status="200",method="GET"})Timestamp:時(shí)間戳(例子中的@1434417560938)

    Prometheus Metrics 兩種表現(xiàn)形式:

    五、標(biāo)簽過(guò)濾器 4 種運(yùn)算符

    =:與字符串匹配!=:與字符串不匹配=~:與正則匹配!~:與正則不匹配

    1)匹配器(Matcher)

    匹配器是作用于標(biāo)簽上的,標(biāo)簽匹配器可以對(duì)時(shí)間序列進(jìn)行過(guò)濾,Prometheus 支持完全匹配和正則匹配兩種模式:完全匹配正則表達(dá)式匹配。

    2)完全匹配

    1、相等匹配器(=)

    相等匹配器(Equality Matcher),用于選擇與提供的字符串完全相同的標(biāo)簽。下面介紹的例子中就會(huì)使用相等匹配器按照條件進(jìn)行一系列過(guò)濾。

    node_cpu_seconds_total{instance="ydzs-master"}

    2、不相等匹配器(!=)

    不相等匹配器(Negative Equality Matcher),用于選擇與提供的字符串不相同的標(biāo)簽。它和相等匹配器是完全相反的。舉個(gè)例子,如果想要查看 job 并不是 HelloWorld 的 HTTP 請(qǐng)求總數(shù),可以使用如下不相等匹配器。

    3)正則表達(dá)式匹配

    1、正則表達(dá)式匹配器(=~)

    正則表達(dá)式匹配器(Regular Expression Matcher),用于選擇與提供的字符串進(jìn)行正則運(yùn)算后所得結(jié)果相匹配的標(biāo)簽。Prometheus 的正則運(yùn)算是強(qiáng)指定的,比如正則表達(dá)式 a 只會(huì)匹配到字符串 a,而并不會(huì)匹配到 ab 或者 ba 或者 abc。如果你不想使用這樣的強(qiáng)指定功能,可以在正則表達(dá)式的前面或者后面加上“.*”。比如下面的例子表示 job 是所有以 Hello 開頭的 HTTP 請(qǐng)求總數(shù)。

    node_cpu_seconds_total{instance=~"ydzs-.*", mode="idle"}

    node_cpu_seconds_total直接等效于{__name__="node_cpu_seconds_total"},后者也可以使用和前者一樣的 4 種匹配器(=,!=,=,!)。比如下面的案例可以表示所有以 Hello 開頭的指標(biāo)。

    {__name__="node_cpu_seconds_total",instance=~"ydzs-.*", mode="idle"}

    2、正則表達(dá)式相反匹配器(!~)

    正則表達(dá)式相反匹配器(Negative Regular Expression Matcher),用于選擇與提供的字符串進(jìn)行正則運(yùn)算后所得結(jié)果不匹配的標(biāo)簽。因?yàn)?PromQL 的正則表達(dá)式基于 RE2 的語(yǔ)法,但是 RE2 不支持向前不匹配表達(dá)式,所以!~的出現(xiàn)是作為一種替代方案,以實(shí)現(xiàn)基于正則表達(dá)式排除指定標(biāo)簽值的功能。在一個(gè)選擇器當(dāng)中,可以針對(duì)同一個(gè)標(biāo)簽來(lái)使用多個(gè)匹配器。比如下面的例子,可以實(shí)現(xiàn)查找 job 名是 node 且安裝在/prometheus 目錄下,但是并不在/prometheus/user 目錄下的所有文件系統(tǒng)并確定其大小。

    node_filesystem_size_bytes{job="node",mountpoint=~"/prometheus/.*", mountpoint!~ "/prometheus/user/.*"}

    六、范圍選擇器

    我們可以通過(guò)將時(shí)間范圍選擇器 range vector selectors 附加到查詢語(yǔ)句中,指定為每個(gè)返回的區(qū)間向量樣本值中提取多長(zhǎng)的時(shí)間范圍。每個(gè)時(shí)間戳的值都是按時(shí)間倒序記錄在時(shí)間序列中的,該值是從時(shí)間范圍內(nèi)的時(shí)間戳獲取的對(duì)應(yīng)的值。

    時(shí)間范圍通過(guò)數(shù)字來(lái)表示,單位可以使用以下其中之一的時(shí)間單位:

    s - 秒m - 分鐘h - 小時(shí)d - 天w - 周y - 年

    比如 node_cpu_seconds_total{instance="ydzs-master",mode="idle"}這個(gè)查詢語(yǔ)句,如果添加上 [1m]這個(gè)時(shí)間范圍選擇器,則我們可以得到如下所示的信息:

    node_cpu_seconds_total{instance="ydzs-master",mode="idle"}[5m]

    這是因?yàn)楝F(xiàn)在每一個(gè)時(shí)間序列中都有多個(gè)時(shí)間戳多個(gè)值,所以沒(méi)辦法渲染,必須是標(biāo)量或者瞬時(shí)向量才可以繪制圖形。

    不過(guò)通常區(qū)間向量都會(huì)應(yīng)用一個(gè)函數(shù)后變成可以繪制的瞬時(shí)向量,Prometheus 中對(duì)瞬時(shí)向量和區(qū)間向量有很多操作的 函數(shù),不過(guò)對(duì)于區(qū)間向量來(lái)說(shuō)最常用的函數(shù)并不多,使用最頻繁的有如下幾個(gè)函數(shù):

    rate(): 計(jì)算整個(gè)時(shí)間范圍內(nèi)區(qū)間向量中時(shí)間序列的每秒平均增長(zhǎng)率。irate(): 僅使用時(shí)間范圍中的最后兩個(gè)數(shù)據(jù)點(diǎn)來(lái)計(jì)算區(qū)間向量中時(shí)間序列的每秒平均增長(zhǎng)率, irate只能用于繪制快速變化的序列,在長(zhǎng)期趨勢(shì)分析或者告警中更推薦使用 rate函數(shù)。increase(): 計(jì)算所選時(shí)間范圍內(nèi)時(shí)間序列的增量,它基本上是速率乘以時(shí)間范圍選擇器中的秒數(shù)。

    七、PromQL 運(yùn)算符

    1)數(shù)學(xué)運(yùn)算符

    數(shù)學(xué)運(yùn)算符比較簡(jiǎn)單,就是簡(jiǎn)單的加減乘除等。

    例如:我們通過(guò) prometheus_http_response_size_bytes_sum可以查詢到 Prometheus 這個(gè)應(yīng)用的 HTTP 響應(yīng)字節(jié)總和。但是這個(gè)單位是字節(jié),我們希望用 MB 顯示。那么我們可以這么設(shè)置:prometheus_http_response_size_bytes_sum/8/1024。

    PromQL 支持的所有數(shù)學(xué)運(yùn)算符如下所示:

    + (加法)- (減法)* (乘法)/ (除法)% (求余)^ (冪運(yùn)算)

    2)布爾運(yùn)算符

    布爾運(yùn)算符支持用戶根據(jù)時(shí)間序列中樣本的值,對(duì)時(shí)間序列進(jìn)行過(guò)濾。

    例如:我們可以通過(guò) prometheus_http_requests_total 查詢出每個(gè)接口的請(qǐng)求次數(shù),但是如果我們想篩選出請(qǐng)求次數(shù)超過(guò) 20 次的接口呢?

    此時(shí)我們可以用下面的 PromQL 表達(dá)式:

    prometheus_http_requests_total > 20

    從上面的圖中我們可以看到,value 的值還是具體的數(shù)值。但如果我們希望對(duì)符合條件的數(shù)據(jù),value 變?yōu)?1。不符合條件的數(shù)據(jù),value 變?yōu)?0。那么我們可以使用bool 修飾符。

    我們使用下面的 PromQL 表達(dá)式:

    prometheus_http_requests_total > bool 20

    目前,Prometheus 支持以下布爾運(yùn)算符如下:

    ==(相等)!=(不相等)>(大于)<(小于)>=(大于或等于)<=(小于或等于)

    3)集合運(yùn)算符

    通過(guò)集合運(yùn)算,可以在兩個(gè)瞬時(shí)向量與瞬時(shí)向量之間進(jìn)行相應(yīng)的集合操作。目前,Prometheus 支持以下集合運(yùn)算符:

    and 與操作or 或操作unless 排除操作

    1、and 與操作

    vector1 and vector2 進(jìn)行一個(gè)與操作,會(huì)產(chǎn)生一個(gè)新的集合。該集合中的元素同時(shí)在 vector1 和 vector2 中都存在。

    例如:我們有 vector1 為 A B C,vector2 為 B C D,那么 vector1 and vector2 的結(jié)果為:B C。

    2、or 或操作

    vector1 and vector2 進(jìn)行一個(gè)或操作,會(huì)產(chǎn)生一個(gè)新的集合。該集合中包含 vector1 和 vector2 中的所有元素。

    例如:我們有 vector1 為 A B C,vector2 為 B C D,那么 vector1 or vector2 的結(jié)果為:A B C D。

    3、unless 排除操作

    vector1 and vector2 進(jìn)行一個(gè)或操作,會(huì)產(chǎn)生一個(gè)新的集合。該集合首先取 vector1 集合的所有元素,然后排除掉所有在 vector2 中存在的元素。

    例如:我們有 vector1 為 A B C,vector2 為 B C D,那么 vector1 unless vector2 的結(jié)果為:A。

    4)操作符優(yōu)先級(jí)

    在 PromQL 操作符中優(yōu)先級(jí)由高到低依次為:

    ^*, /, %+, -==, !=, <=, <, >=, >and, unlessor

    八、PromQL 內(nèi)置函數(shù)

    Prometheus 提供了其它大量的內(nèi)置函數(shù),可以對(duì)時(shí)序數(shù)據(jù)進(jìn)行豐富的處理。某些函數(shù)有默認(rèn)的參數(shù),例如:year(v=vector(time()) instant-vector)。其中參數(shù) v 是一個(gè)瞬時(shí)向量,如果不提供該參數(shù),將使用默認(rèn)值 vector(time())。instant-vector 表示參數(shù)類型。

    1) abs()

    abs(v instant-vector) 返回輸入向量的所有樣本的絕對(duì)值。

    2)absent()

    absent(v instant-vector),如果傳遞給它的向量參數(shù)具有樣本數(shù)據(jù),則返回空向量;如果傳遞的向量參數(shù)沒(méi)有樣本數(shù)據(jù),則返回不帶度量指標(biāo)名稱且?guī)в袠?biāo)簽的時(shí)間序列,且樣本值為 1。

    當(dāng)監(jiān)控度量指標(biāo)時(shí),如果獲取到的樣本數(shù)據(jù)是空的, 使用 absent 方法對(duì)告警是非常有用的。例如:

    # 這里提供的向量有樣本數(shù)據(jù)absent(http_requests_total{method="get"})  => no dataabsent(sum(http_requests_total{method="get"}))  => no data# 由于不存在度量指標(biāo) nonexistent,所以 返回不帶度量指標(biāo)名稱且?guī)в袠?biāo)簽的時(shí)間序列,且樣本值為1absent(nonexistent{job="myjob"})  => {job="myjob"}  1# 正則匹配的 instance 不作為返回 labels 中的一部分absent(nonexistent{job="myjob",instance=~".*"})  => {job="myjob"}  1# sum 函數(shù)返回的時(shí)間序列不帶有標(biāo)簽,且沒(méi)有樣本數(shù)據(jù)absent(sum(nonexistent{job="myjob"}))  => {}  1

    3)ceil()

    ceil(v instant-vector)將 v 中所有元素的樣本值向上四舍五入到最接近的整數(shù)。例如:

    node_load5{instance="192.168.1.75:9100"} # 結(jié)果為 2.79ceil(node_load5{instance="192.168.1.75:9100"}) # 結(jié)果為 3

    4)changes()

    changes(v range-vector)輸入一個(gè)區(qū)間向量, 返回這個(gè)區(qū)間向量?jī)?nèi)每個(gè)樣本數(shù)據(jù)值變化的次數(shù)(瞬時(shí)向量)。例如:

    # 如果樣本數(shù)據(jù)值沒(méi)有發(fā)生變化,則返回結(jié)果為 1changes(node_load5{instance="192.168.1.75:9100"}[1m]) # 結(jié)果為 1

    5)clamp_max()

    clamp_max(v instant-vector, max scalar)函數(shù),輸入一個(gè)瞬時(shí)向量和最大值,樣本數(shù)據(jù)值若大于 max,則改為 max,否則不變。例如:

    node_load5{instance="192.168.1.75:9100"} # 結(jié)果為 2.79clamp_max(node_load5{instance="192.168.1.75:9100"}, 2) # 結(jié)果為 2

    6)clamp_min()

    clamp_min(v instant-vector, min scalar)函數(shù),輸入一個(gè)瞬時(shí)向量和最小值,樣本數(shù)據(jù)值若小于 min,則改為 min,否則不變。例如:

    node_load5{instance="192.168.1.75:9100"} # 結(jié)果為 2.79clamp_min(node_load5{instance="192.168.1.75:9100"}, 3) # 結(jié)果為 3

    7)day_of_month()

    day_of_month(v=vector(time()) instant-vector)函數(shù),返回被給定 UTC 時(shí)間所在月的第幾天。返回值范圍:1~31。

    8)day_of_week()

    day_of_week(v=vector(time()) instant-vector)函數(shù),返回被給定 UTC 時(shí)間所在周的第幾天。返回值范圍:0~6,0 表示星期天。

    9)days_in_month()

    days_in_month(v=vector(time()) instant-vector)函數(shù),返回當(dāng)月一共有多少天。返回值范圍:28~31。

    10)delta()

    delta(v range-vector)的參數(shù)是一個(gè)區(qū)間向量,返回一個(gè)瞬時(shí)向量。它計(jì)算一個(gè)區(qū)間向量 v 的第一個(gè)元素和最后一個(gè)元素之間的差值。由于這個(gè)值被外推到指定的整個(gè)時(shí)間范圍,所以即使樣本值都是整數(shù),你仍然可能會(huì)得到一個(gè)非整數(shù)值。

    例如,下面的例子返回過(guò)去兩小時(shí)的 CPU 溫度差:

    delta(cpu_temp_celsius{host="zeus"}[2h])

    11)deriv()

    deriv(v range-vector)的參數(shù)是一個(gè)區(qū)間向量,返回一個(gè)瞬時(shí)向量。它使用簡(jiǎn)單的線性回歸計(jì)算區(qū)間向量 v 中各個(gè)時(shí)間序列的導(dǎo)數(shù)。這個(gè)函數(shù)一般只用在 Gauge 類型的時(shí)間序列上。

    12)exp()

    exp(v instant-vector)函數(shù),輸入一個(gè)瞬時(shí)向量,返回各個(gè)樣本值的 e 的指數(shù)值,即 e 的 N 次方。當(dāng) N 的值足夠大時(shí)會(huì)返回 +Inf。特殊情況為:

    Exp(+Inf) = +InfExp(NaN) = NaN

    13)floor()

    floor(v instant-vector)函數(shù)與 ceil() 函數(shù)相反,將 v 中所有元素的樣本值向下四舍五入到最接近的整數(shù)。

    14)histogram_quantile()

    histogram_quantile(φ float, b instant-vector)從 bucket 類型的向量 b 中計(jì)算 φ (0 ≤ φ ≤ 1) 分位數(shù)(百分位數(shù)的一般形式)的樣本的最大值。(有關(guān) φ 分位數(shù)的詳細(xì)說(shuō)明以及直方圖指標(biāo)類型的使用,請(qǐng)參閱直方圖和摘要)。向量 b 中的樣本是每個(gè) bucket 的采樣點(diǎn)數(shù)量。每個(gè)樣本的 labels 中必須要有 le 這個(gè) label 來(lái)表示每個(gè) bucket 的上邊界,沒(méi)有 le 標(biāo)簽的樣本會(huì)被忽略。直方圖指標(biāo)類型自動(dòng)提供帶有 _bucket 后綴和相應(yīng)標(biāo)簽的時(shí)間序列。可以使用 rate() 函數(shù)來(lái)指定分位數(shù)計(jì)算的時(shí)間窗口。

    例如:一個(gè)直方圖指標(biāo)名稱為 employee_age_bucket_bucket,要計(jì)算過(guò)去 10 分鐘內(nèi) 第 90 個(gè)百分位數(shù),請(qǐng)使用以下表達(dá)式:

    histogram_quantile(0.9, rate(employee_age_bucket_bucket[10m]))

    返回:

    {instance="10.0.86.71:8080",job="prometheus"} 35.714285714285715

    這表示最近 10 分鐘之內(nèi) 90% 的樣本的最大值為 35.714285714285715。

    15)holt_winters()

    holt_winters(v range-vector, sf scalar, tf scalar)函數(shù)基于區(qū)間向量 v,生成時(shí)間序列數(shù)據(jù)平滑值。平滑因子 sf 越低, 對(duì)舊數(shù)據(jù)的重視程度越高。趨勢(shì)因子 tf 越高,對(duì)數(shù)據(jù)的趨勢(shì)的考慮就越多。其中,0< sf, tf <=1。holt_winters 僅適用于 Gauge類型的時(shí)間序列。

    16)hour()

    hour(v=vector(time()) instant-vector)函數(shù)返回被給定 UTC 時(shí)間的當(dāng)前第幾個(gè)小時(shí),時(shí)間范圍:0~23。

    17)idelta()

    idelta(v range-vector)的參數(shù)是一個(gè)區(qū)間向量, 返回一個(gè)瞬時(shí)向量。它計(jì)算最新的 2 個(gè)樣本值之間的差值。這個(gè)函數(shù)一般只用在 Gauge 類型的時(shí)間序列上。

    18)increase()

    increase(v range-vector)函數(shù)獲取區(qū)間向量中的第一個(gè)和最后一個(gè)樣本并返回其增長(zhǎng)量, 它會(huì)在單調(diào)性發(fā)生變化時(shí)(如由于采樣目標(biāo)重啟引起的計(jì)數(shù)器復(fù)位)自動(dòng)中斷。由于這個(gè)值被外推到指定的整個(gè)時(shí)間范圍,所以即使樣本值都是整數(shù),你仍然可能會(huì)得到一個(gè)非整數(shù)值。

    例如:以下表達(dá)式返回區(qū)間向量中每個(gè)時(shí)間序列過(guò)去 5 分鐘內(nèi) HTTP 請(qǐng)求數(shù)的增長(zhǎng)數(shù):

    increase(http_requests_total{job="apiserver"}[5m])

    increase 的返回值類型只能是計(jì)數(shù)器類型,主要作用是增加圖表和數(shù)據(jù)的可讀性。使用 rate 函數(shù)記錄規(guī)則的使用率,以便持續(xù)跟蹤數(shù)據(jù)樣本值的變化。

    19)irate()

    irate(v range-vector)函數(shù)用于計(jì)算區(qū)間向量的增長(zhǎng)率,但是其反應(yīng)出的是瞬時(shí)增長(zhǎng)率。irate 函數(shù)是通過(guò)區(qū)間向量中最后兩個(gè)兩本數(shù)據(jù)來(lái)計(jì)算區(qū)間向量的增長(zhǎng)速率,它會(huì)在單調(diào)性發(fā)生變化時(shí)(如由于采樣目標(biāo)重啟引起的計(jì)數(shù)器復(fù)位)自動(dòng)中斷。這種方式可以避免在時(shí)間窗口范圍內(nèi)的“長(zhǎng)尾問(wèn)題”,并且體現(xiàn)出更好的靈敏度,通過(guò) irate 函數(shù)繪制的圖標(biāo)能夠更好的反應(yīng)樣本數(shù)據(jù)的瞬時(shí)變化狀態(tài)。

    例如:以下表達(dá)式返回區(qū)間向量中每個(gè)時(shí)間序列過(guò)去 5 分鐘內(nèi)最后兩個(gè)樣本數(shù)據(jù)的 HTTP 請(qǐng)求數(shù)的增長(zhǎng)率:

    irate(http_requests_total{job="api-server"}[5m])

    20)label_join()

    label_join(v instant-vector, dst_label string, separator string, src_label_1 string, src_label_2 string, ...)函數(shù)可以將時(shí)間序列 v 中多個(gè)標(biāo)簽 src_label 的值,通過(guò) separator 作為連接符寫入到一個(gè)新的標(biāo)簽 dst_label 中。可以有多個(gè) src_label 標(biāo)簽。

    例如:以下表達(dá)式返回的時(shí)間序列多了一個(gè) foo 標(biāo)簽,標(biāo)簽值為 etcd,etcd-k8s:

    up{endpoint="api",instance="192.168.123.248:2379",job="etcd",namespace="monitoring",service="etcd-k8s"}=> up{endpoint="api",instance="192.168.123.248:2379",job="etcd",namespace="monitoring",service="etcd-k8s"}  1label_join(up{endpoint="api",instance="192.168.123.248:2379",job="etcd",namespace="monitoring",service="etcd-k8s"}, "foo", ",", "job", "service")=> up{endpoint="api",foo="etcd,etcd-k8s",instance="192.168.123.248:2379",job="etcd",namespace="monitoring",service="etcd-k8s"}  1

    21)label_replace()

    為了能夠讓客戶端的圖標(biāo)更具有可讀性,可以通過(guò) label_replace 函數(shù)為時(shí)間序列添加額外的標(biāo)簽。label_replace 的具體參數(shù)如下:

    label_replace(v instant-vector, dst_label string, replacement string, src_label string, regex string)

    該函數(shù)會(huì)依次對(duì) v 中的每一條時(shí)間序列進(jìn)行處理,通過(guò) regex 匹配 src_label 的值,并將匹配部分 relacement 寫入到 dst_label 標(biāo)簽中。如下所示:

    label_replace(up, "host", "$1", "instance",  "(.*):.*")

    函數(shù)處理后,時(shí)間序列將包含一個(gè) host 標(biāo)簽,host 標(biāo)簽的值為 Exporter 實(shí)例的 IP 地址:

    up{host="localhost",instance="localhost:8080",job="cadvisor"}   1up{host="localhost",instance="localhost:9090",job="prometheus"}   1up{host="localhost",instance="localhost:9100",job="node"}   1

    22)ln()

    ln(v instant-vector) 計(jì)算瞬時(shí)向量 v 中所有樣本數(shù)據(jù)的自然對(duì)數(shù)。特殊情況:

    ln(+Inf) = +Infln(0) = -Infln(x < 0) = NaNln(NaN) = NaN

    23)log2()

    log2(v instant-vector)函數(shù)計(jì)算瞬時(shí)向量 v 中所有樣本數(shù)據(jù)的二進(jìn)制對(duì)數(shù)。特殊情況同上。

    24)log10()

    log10(v instant-vector)計(jì)算瞬時(shí)向量 v 中所有樣本數(shù)據(jù)的十進(jìn)制對(duì)數(shù)。特殊情況同上。

    25)minute()

    minute(v=vector(time()) instant-vector)函數(shù)返回給定 UTC 時(shí)間當(dāng)前小時(shí)的第多少分鐘。結(jié)果范圍:0~59。

    26)month()

    month(v=vector(time()) instant-vector)函數(shù)返回給定 UTC 時(shí)間當(dāng)前屬于第幾個(gè)月,結(jié)果范圍:0~12。

    27)predict_linear()

    predict_linear(v range-vector, t scalar)函數(shù)可以預(yù)測(cè)時(shí)間序列 v 在 t 秒后的值。它基于簡(jiǎn)單線性回歸的方式,對(duì)時(shí)間窗口內(nèi)的樣本數(shù)據(jù)進(jìn)行統(tǒng)計(jì),從而可以對(duì)時(shí)間序列的變化趨勢(shì)做出預(yù)測(cè)。該函數(shù)的返回結(jié)果不帶有度量指標(biāo),只有標(biāo)簽列表。

    例如,基于 2 小時(shí)的樣本數(shù)據(jù),來(lái)預(yù)測(cè)主機(jī)可用磁盤空間的是否在 4 個(gè)小時(shí)候被占滿,可以使用如下表達(dá)式:

    predict_linear(node_filesystem_free{job="node"}[2h], 4 * 3600) < 0

    28)rate()

    rate(v range-vector)函數(shù)可以直接計(jì)算區(qū)間向量 v 在時(shí)間窗口內(nèi)平均增長(zhǎng)速率,它會(huì)在單調(diào)性發(fā)生變化時(shí)(如由于采樣目標(biāo)重啟引起的計(jì)數(shù)器復(fù)位)自動(dòng)中斷。該函數(shù)的返回結(jié)果不帶有度量指標(biāo),只有標(biāo)簽列表。

    例如,以下表達(dá)式返回區(qū)間向量中每個(gè)時(shí)間序列過(guò)去 5 分鐘內(nèi) HTTP 請(qǐng)求數(shù)的每秒增長(zhǎng)率:

    rate(http_requests_total[5m])結(jié)果:{code="200",handler="label_values",instance="120.77.65.193:9090",job="prometheus",method="get"} 0{code="200",handler="query_range",instance="120.77.65.193:9090",job="prometheus",method="get"}  0{code="200",handler="prometheus",instance="120.77.65.193:9090",job="prometheus",method="get"}   0.2...

    rate() 函數(shù)返回值類型只能用計(jì)數(shù)器,在長(zhǎng)期趨勢(shì)分析或者告警中推薦使用這個(gè)函數(shù)。

    注意:

    當(dāng)將 rate() 函數(shù)與聚合運(yùn)算符(例如 sum())或隨時(shí)間聚合的函數(shù)(任何以 _over_time 結(jié)尾的函數(shù))一起使用時(shí),必須先執(zhí)行 rate 函數(shù),然后再進(jìn)行聚合操作,否則當(dāng)采樣目標(biāo)重新啟動(dòng)時(shí) rate() 無(wú)法檢測(cè)到計(jì)數(shù)器是否被重置。

    29)resets()

    resets(v range-vector)的參數(shù)是一個(gè)區(qū)間向量。對(duì)于每個(gè)時(shí)間序列,它都返回一個(gè)計(jì)數(shù)器重置的次數(shù)。兩個(gè)連續(xù)樣本之間的值的減少被認(rèn)為是一次計(jì)數(shù)器重置。

    這個(gè)函數(shù)一般只用在計(jì)數(shù)器類型的時(shí)間序列上。

    30)round()

    round(v instant-vector, to_nearest=1 scalar)函數(shù)與 ceil 和 floor 函數(shù)類似,返回向量中所有樣本值的最接近的整數(shù)。to_nearest 參數(shù)是可選的,默認(rèn)為 1,表示樣本返回的是最接近 1 的整數(shù)倍的值。你也可以將該參數(shù)指定為任意值(也可以是小數(shù)),表示樣本返回的是最接近它的整數(shù)倍的值。

    31)scalar()

    scalar(v instant-vector)函數(shù)的參數(shù)是一個(gè)單元素的瞬時(shí)向量,它返回其唯一的時(shí)間序列的值作為一個(gè)標(biāo)量。如果度量指標(biāo)的樣本數(shù)量大于 1 或者等于 0, 則返回 NaN。

    32) sort()

    sort(v instant-vector)函數(shù)對(duì)向量按元素的值進(jìn)行升序排序,返回結(jié)果:key: value = 度量指標(biāo):樣本值[升序排列]。

    33)sort_desc()

    sort(v instant-vector)函數(shù)對(duì)向量按元素的值進(jìn)行降序排序,返回結(jié)果:key: value = 度量指標(biāo):樣本值[降序排列]。

    34) sqrt()

    sqrt(v instant-vector)函數(shù)計(jì)算向量 v 中所有元素的平方根。

    35)time()

    time()函數(shù)返回從 1970-01-01 到現(xiàn)在的秒數(shù)。注意:它不是直接返回當(dāng)前時(shí)間,而是時(shí)間戳

    36)timestamp()

    timestamp(v instant-vector)函數(shù)返回向量 v 中的每個(gè)樣本的時(shí)間戳(從 1970-01-01 到現(xiàn)在的秒數(shù))。

    該函數(shù)從 Prometheus 2.0 版本開始引入。

    37)vector()

    vector(s scalar)函數(shù)將標(biāo)量 s 作為沒(méi)有標(biāo)簽的向量返回,即返回結(jié)果為:key: value= {}, s。

    38)year()

    year(v=vector(time()) instant-vector)函數(shù)返回被給定 UTC 時(shí)間的當(dāng)前年份。

    39)_over_time()

    下面的函數(shù)列表允許傳入一個(gè)區(qū)間向量,它們會(huì)聚合每個(gè)時(shí)間序列的范圍,并返回一個(gè)瞬時(shí)向量:

    avg_over_time(range-vector) : 區(qū)間向量?jī)?nèi)每個(gè)度量指標(biāo)的平均值。min_over_time(range-vector) : 區(qū)間向量?jī)?nèi)每個(gè)度量指標(biāo)的最小值。max_over_time(range-vector) : 區(qū)間向量?jī)?nèi)每個(gè)度量指標(biāo)的最大值。sum_over_time(range-vector) : 區(qū)間向量?jī)?nèi)每個(gè)度量指標(biāo)的求和。count_over_time(range-vector) : 區(qū)間向量?jī)?nèi)每個(gè)度量指標(biāo)的樣本數(shù)據(jù)個(gè)數(shù)。quantile_over_time(scalar, range-vector) : 區(qū)間向量?jī)?nèi)每個(gè)度量指標(biāo)的樣本數(shù)據(jù)值分位數(shù),φ-quantile (0 ≤ φ ≤ 1)。stddev_over_time(range-vector) : 區(qū)間向量?jī)?nèi)每個(gè)度量指標(biāo)的總體標(biāo)準(zhǔn)差。stdvar_over_time(range-vector) : 區(qū)間向量?jī)?nèi)每個(gè)度量指標(biāo)的總體標(biāo)準(zhǔn)方差。12345678

    注意:

    即使區(qū)間向量?jī)?nèi)的值分布不均勻,它們?cè)诰酆蠒r(shí)的權(quán)重也是相同的。

    八、PromQL 聚合操作

    Prometheus 還提供了聚合操作符,這些操作符作用于瞬時(shí)向量。可以將瞬時(shí)表達(dá)式返回的樣本數(shù)據(jù)進(jìn)行聚合,形成一個(gè)新的時(shí)間序列。目前支持的聚合函數(shù)有:

    sum (求和)min (最小值)max (最大值)avg (平均值)stddev (標(biāo)準(zhǔn)差)stdvar (標(biāo)準(zhǔn)方差)count (計(jì)數(shù))count_values (對(duì) value 進(jìn)行計(jì)數(shù))bottomk (后 n 條時(shí)序)topk (前 n 條時(shí)序)

    1)sum 求和

    用于對(duì)記錄的 value 值進(jìn)行求和。

    例如:sum(prometheus_http_requests_total)表示統(tǒng)計(jì)所有 HTTP 請(qǐng)求的次數(shù)。

    sum(prometheus_http_requests_total)

    2)min 最小值

    返回所有記錄的最小值。

    例如:min(prometheus_http_requests_total)表示獲取數(shù)據(jù)集合中的最小值。

    min(prometheus_http_requests_total)

    3)max 最大值

    返回所有記錄的最大值。

    例如:maxmetheus_http_requests_total)` 表示獲取數(shù)據(jù)集合中的最大值。

    max(prometheus_http_requests_total)

    4)avg 平均值

    avg 函數(shù)返回所有記錄的平均值。

    例如:avg(metheus_http_requests_total)表示獲取數(shù)據(jù)集合中的平均值。

    avg(prometheus_http_requests_total)

    5)stddev 標(biāo)準(zhǔn)差

    標(biāo)準(zhǔn)差(Standard Deviation)常用來(lái)描述數(shù)據(jù)的波動(dòng)大小。

    例如:統(tǒng)計(jì)出不同 HTTP 請(qǐng)求的數(shù)量波動(dòng)情況。

    stddev(prometheus_http_requests_total)

    6)count 計(jì)數(shù)

    count 函數(shù)返回所有記錄的計(jì)數(shù)。

    例如:count(prometheus_http_requests_total)表示統(tǒng)計(jì)所有 HTTP 請(qǐng)求的次數(shù)。

    count(prometheus_http_requests_total)

    7)bottomk 后幾條

    bottomk 用于對(duì)樣本值進(jìn)行排序,返回當(dāng)前樣本值后 N 位的時(shí)間序列。

    例如:獲取 HTTP 請(qǐng)求量后 5 位的請(qǐng)求,可以使用表達(dá)式:

    bottomk(5, prometheus_http_requests_total)

    8)topk 前幾條

    topk 用于對(duì)樣本值進(jìn)行排序,返回當(dāng)前樣本值前 N 位的時(shí)間序列。

    例如:獲取 HTTP 請(qǐng)求量前 5 位的請(qǐng)求,可以使用表達(dá)式:

    topk(5, prometheus_http_requests_total)

    九、PromQL 非法總結(jié)

    由于所有的 PromQL 表達(dá)式必須至少包含一個(gè)指標(biāo)名稱,或者至少有一個(gè)不會(huì)匹配到空字符串的標(biāo)簽過(guò)濾器,因此結(jié)合 Prometheus 官方文檔,可以梳理出如下非法示例。

    {job=~".*"} # 非法!.*表示任意一個(gè)字符,這就包括空字符串,且還沒(méi)有指標(biāo)名稱{job=""}    # 非法!{job!=""}   # 非法!

    相反,如下表達(dá)式是合法的。

    {job=~".+"}               # 合法!.+表示至少一個(gè)字符{job=~".*",method="get"}  # 合法!.*表示任意一個(gè)字符{job="",method="post"}    # 合法!存在一個(gè)非空匹配{job=~".+",method="post"} # 合法!存在一個(gè)非空匹配

    關(guān)于 Prometheus PromQL 講解就先到這里了,其實(shí)官網(wǎng)介紹的很清楚,也不難,多使用就很容易掌握了,有疑問(wèn)的小伙伴歡迎給我留言,后續(xù)會(huì)持續(xù)更新【云原生+大數(shù)據(jù)】的文章,請(qǐng)小伙伴耐心等待~

    關(guān)鍵詞:

    相關(guān)閱讀
    分享到:
    版權(quán)和免責(zé)申明

    凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來(lái)源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。

    Copyright ? 1999-2017 cqtimes.cn All Rights Reserved 環(huán)球傳媒網(wǎng)-重新發(fā)現(xiàn)生活版權(quán)所有 聯(lián)系郵箱:8553 591@qq.com
    久久激情五月网站,一本色道综合亚洲精品精品,午夜电影久久久久久,中文无码AV片在线 成a在线观看视频播放 婷婷色中文在线观看
  • <rt id="2wkqu"><small id="2wkqu"></small></rt>