問題描述 兩臺部署的gatewayworker服務(wù),硬件配置為16核32G,最近半個月經(jīng)常出現(xiàn)一臺機(jī)器上的幾個gateway進(jìn)程cpu跑滿100%,導(dǎo)致業(yè)務(wù)無法正常轉(zhuǎn)發(fā)。 故障時status信息如下: worker進(jìn)程顯示不出來 通過strace -ttp 異常進(jìn)程,得到的信息如下 另外開啟了框架調(diào)試日志,輸出的結(jié)果如下172.17.201.188是本機(jī)內(nèi)網(wǎng)ip: ...
問題描述 生產(chǎn)環(huán)境是2臺16核32G的配置,按照手冊分布式部署,配置gateway進(jìn)程16個,和worker進(jìn)程數(shù)100個, 使用壓力測試系統(tǒng)并發(fā)2000個鏈接,只鏈接,不發(fā)送業(yè)務(wù)處理。在壓力測試下,gateway進(jìn)程cpu個別跑滿,其他的也大都在70%,壓力測試關(guān)掉后很長一段時間,有一個gateway進(jìn)程cpu始終100%,其他gateway進(jìn)程cpu基本回落到0,該狀態(tài)下,業(yè)務(wù)系統(tǒng)可以正常鏈接上gateway,但...
目前按照分布式的方式部署了2臺gatewayworker,每臺開30個gateway進(jìn)程,100個bussinessworker進(jìn)程(16核32G,云服務(wù)商主機(jī)),注冊中心放在其中一臺上面,上周兩臺服務(wù)器cpu由于業(yè)務(wù)增長,cpu達(dá)到了50%,cpu的sy指標(biāo)都高于us,差不多是us的兩倍,為了應(yīng)付后續(xù)的業(yè)務(wù)增長,增加部署了兩臺(8核16G),但是發(fā)現(xiàn)對之前2臺的cpu都沒有起到降低作用,基本沒有變化。實在是搞不懂這...
服務(wù)運行一段時間后就會出現(xiàn)一下錯誤,然后其他第三方服務(wù)發(fā)送給gatawayworker的數(shù)據(jù)就收不到返回了,這種情況下要如何排查: 2017-01-07 16:07:52 Workerman status 2017-01-08 13:53:22 WORKER EXIT UNEXPECTED 2017-01-08 13:53:24 worker exit with status 64000 2017-01-08 13:...
1.gatewayworkerman 目前是分布式部署,部署2臺,作為通訊中訊服務(wù),然后入口是一臺負(fù)載均衡服務(wù)器,會自動代理鏈接分發(fā)到2臺任意一臺。 程序邏輯大致如下: onMessage(clientid,message) { (1)記錄message消息進(jìn)入文件日志 logger(message); //產(chǎn)生問題,繼續(xù)往下看完 (2)判斷數(shù)據(jù)包類型...
目前使用gatawayworker搭建了一個名為proxy_server的服務(wù),主要就是數(shù)據(jù)轉(zhuǎn)發(fā)而已,沒有涉及什么數(shù)據(jù)庫等東西。目前并沒有找到什么規(guī)律,有時候從進(jìn)程里看到php的cpu占用非常高,每個php進(jìn)程都到了80-95的占用。重新啟動 gatawayworker服務(wù)可以恢復(fù)正常狀態(tài)?,F(xiàn)在看日志也不知道是哪里的原因,只看到日志里有以下記錄: 2016-11-14 21:43:16 WORKER EXIT UNE...