運維問題 TKE容器內部無法通過內網訪問CVM里面的服務 最近發現k8s容器內無法訪問內網的負載均衡,直接訪問后端CVM也不行。使用的是騰訊云的TKE和clb,clb后端負載了三個CVM服務器。其他集群容器內部都可以通過內網訪問這個clb和cvm。在排查了所... 11月14日 62 ℃ 發表評論 閱讀全文
運維問題 Fluentd報錯failed to flush the buffer解決辦法 最近EFK遇到一個問題,就是當集群的歷史日志過多的時候,新安裝的EFK會因為數據太多導致無法把數據轉發到Elasticsearch,如果Elasticsearch內小會出現內存溢出的情況。Fluent... 06月06日 676 ℃ 發表評論 閱讀全文
運維問題 Kong-ingress-controller Read-timeout超時時間設置 今天開發反饋有個項目導入接口60s就超時了,按照之前其他項目的經驗,在騰訊云LB設置proxy_read_timeout和proxy_send_timeout就正常了,因為這兩個參數剛好默認是60s,... 04月12日 1,166 ℃ 發表評論 閱讀全文
運維文檔 在阿里云ACK使用Traefik Ingress并通過已有的SLB負載均衡公開應用 阿里云的ACK默認只提供了3個Ingress Controller組件的自動安裝,分別是ALB Ingress Controller、MSE Ingress Controller和Nginx Ingr... 01月01日 907 ℃ 發表評論 閱讀全文
運維視界 4個Kubernetes 默認Namespace(命名空間)介紹 Kubernetes 隨帶許多( Namespace )命名空間。一些命名空間很重要,事關你的Kubernetes使用是否正常!搞壞其中一個命名空間即會損壞Kubernetes系統。這些命名空間包括如... 01月12日 1,625 ℃ 發表評論 閱讀全文
生活隨筆 被阿里”領導”上了一課,感受了一次阿里文化 事情的起因是因為在使用阿里云的ACK的Terway網絡插件時,遇到了一些問題,具體問題可以查看《阿里云ACK網絡插件Terway踩坑記》,然后提交工單半天沒回復,就讓售前運營幫我催一下。售前運營也是出... 11月12日 1,257 ℃ 1 閱讀全文
運維問題 阿里云ACK網絡插件Terway踩坑記 先來看看阿里云官方對Terway的介紹:什么是Terway網絡插件Terway是阿里云開源的基于專有網絡VPC的容器網絡接口CNI(Container Network Interface)插件,支持基... 11月12日 2,888 ℃ 發表評論 閱讀全文
生活隨筆 一次馬虎大意造成的事故 最近生產環境服務器快到期了,就想著把一直使用docker-compose部署的canal和elasticsearch遷移到kubernetes集群。由于在這之前開發、測試、預生產的canal我都已經遷... 11月12日 1,556 ℃ 2 閱讀全文
科技視界 十款開源的服務網格(Service Mesh)介紹 什么是服務網格服務網格近年來有很高的話題度,背后的原因是什么?2017年底,非侵入式的 Service Mesh 技術從萌芽到走向了成熟。Service Mesh 又譯作“服務網格”,作為服務間通信的... 10月29日 2,858 ℃ 發表評論 閱讀全文
運維問題 Kubernetes的生態系統和特性 Kubernetes 的主要優勢在于,它提供了一個便捷有效的平臺,讓用戶可以在物理機和虛擬機集群上調度與運行容器。進一步來說,Kubernctes 是一個支持彈性運行的分布式系統框架,是一種支撐其他平... 08月26日 943 ℃ 發表評論 閱讀全文
運維視界 為什么需要kubernetes這樣的容器編排系統 Docker 本身非常適合管理單個容器,若運行的是構建于有限幾個或十幾個容器上的應用程序,則可以僅在 Docker 引擎上自主運行,部署和管理這些容器并不會遇到太大的困難。然而,對于包含成百上千個容器... 08月25日 968 ℃ 發表評論 閱讀全文
運維視界 數據庫適不適合Docker容器化部署 網上有一篇文章提到數據庫不適合容器化的七大原因:1、數據不安全2、運行數據庫的環境需求3、網絡問題4、狀態5、數據庫不適合使用主要的Docker功能6、額外的隔離對數據庫是不利的7、云平臺的不適用性當... 08月24日 2,081 ℃ 發表評論 閱讀全文
科技視界 2021年11款最佳的開源Kubernetes工具 到 2021 年,幾乎所有接觸過云基礎設施的人都熟悉 Kubernetes 項目。簡單地說,Kubernetes 是一個非常強大的容器編排平臺,并且 Kubernetes 社區一直在共享工具,這有助于... 08月24日 883 ℃ 發表評論 閱讀全文
運維問題 阿里云日志服務SLS采集kubernetes集群日志踩坑記 最近在使用阿里云日志進行“上下文瀏覽”和“LiveTail”的時候突然發現無法正常過濾。比如:我要實時查看eureka服務的日志,通過“Pod名稱”或者“容器名稱”過濾以后,LiveTail還是會顯示... 08月17日 1,963 ℃ 發表評論 閱讀全文
運維問題 Kubernetes集群中SpringBoot服務的健康探測優化 今天在維護預生產環境的數據庫的時候,發生了一個災難性的故障(還好不是生產環境),集群中除了eureka和zuul的其他服務全部springboot服務都變成了不可用狀態,容器在不停的重啟中,出現這種情... 08月09日 1,855 ℃ 發表評論 閱讀全文
運維問題 Kubernetes1.20 創建pvc報錯selfLink was empty, can’t make reference 最近把kubernetes集群從1.18升級到1.20以后,新建pvc一直處于pending狀態,查看nfs-client-provisioner日志,提示:unexpected error... 07月05日 4,995 ℃ 1 閱讀全文
運維問題 同一個docker鏡像在不同的服務器運行/tmp目錄權限不一致解決辦法 今天遇到一個比較有意思的問題,在kubernetes集群創建了一個springcloud服務,在其中一臺node上面很快就啟動成功,顯示running了,但是在另外一臺node上面,等了很久都沒啟動成... 07月05日 2,838 ℃ 發表評論 閱讀全文
運維文檔 kubernetes內網和本地局域網互通方法 kubernetes集群部署好以后,我們是無法直接在集群外部訪問集群內的網絡環境。當我們把SpringCloud的微服務遷移到k8s 中后,雖然不需要做什么改動,微服務實例就可以注冊到Eureka注冊... 06月29日 4,120 ℃ 發表評論 閱讀全文
運維文檔 Kubernetes集群Prometheus Operator釘釘報警配置 最近把Prometheus監控遷移到了kubernetes集群中,部署文檔參考《Kubernetes環境使用Prometheus Operator自發現監控SpringBoot》,各類監控項的數據采集... 09月29日 4,676 ℃ 發表評論 閱讀全文
運維文檔 Kubernetes集群中部署ZooKeeper集群 Kubernetes集群中部署ZooKeeper集群有兩種方式,一是基于kubernetes的鏡像kubernetes-zookeeper,另外一種是基于原生的鏡像zookeeper,基于kubern... 09月21日 3,296 ℃ 發表評論 閱讀全文