开源私有云全能冠军proxmox,一键安装,一条指令即可建立起集群。不借助外挂存储,不需要什么控制中心,谁都可以做老大,死了谁都不要紧。用了好长一段时间,把服务器虚拟化与桌面虚拟化整合到一起,这才是真超融合呢!
接到一个求助电话,说是有个阿里云上的服务器,有性能瓶颈,但又没有什么具体的数据,只是说偶尔客户端有少数连接不上,或者连接会突然中断。我的天,最怕这种状况了,还得自己去找问题表现是什么,再去找什么原因所致。因为是线上的环境,得分两步进行。先检查,看系统或者应用存在什么明显的印迹,分析原因和处理方法;协商什么时候可以处理,处理风险是什么。怕影响用户体验,白天还不让搞。月黑风高,家里有没暖气啊(用一块闲
发件人: 周** 发送时间: 2011-03-04 18:54:37 收件人: sery 抄送: 主题: 请教问题 我看你们的服务器的连接都是比较正常的 [root@381263 conf]# netstat -n |&n
作者:田逸(formyz)一个NFS服务器,为多个Web项目所共享。这些目录包括PHP程序、图片、HTML页面和用户上传的文档和附件等。因为某些Web框架古老,存在诸如不对上传文件做严格的安全性检查,虽然此NFS服务器位于受保护的内部网络,但任然被别有用心的人上传了大量的恶意文件。强烈要求程序员进行程序(Discuz)更新,答复说更新难度太大,无法在程序上进行处理。从系统管理层面上,临时的措施仅仅
MongoDB自身可可组成分片加复制的集群,在这个集群的前端加上负载均衡器(比如HAProxmy + Keepalived),就可组建成一个无单点故障、十分完美的高可用负载均衡集群(如图8-1所示)。图8- 1整个MongDB高可用体系结构中,存在四个应用集群:入口路由集群Mongos、配置集群“Config Server”、分片集群1、分片集群2。入口路由集群“Mongos”由负载均衡器来实现高
作者:田逸(vx:formyz)需求产生在某地运营商机房租了几台服务器,为了节省成本,租的都是低配且年级比较大的服务器。选择其中三台做成ProxmoxVE超融合集群,平台上的虚拟机配置成高可用,存储为分布式去中心化Ceph。这三个节点的配置为内存64G(16根4G单条)、6块7200转容量为2TB的低速机械盘,性能相当的差。将一些边缘业务、不太重要的应用放在这样一个性能不高的平台上,虽然运行时资
作者:田逸(formyz)江湖救急,一老友告知,一运行Gitlab的主机负载很高,并且把整个出口带宽都耗尽了,希帮忙处理。根据经验,直接答复“很可能被挖矿了”。在取得系统权限以后,登录到该系统。查看系统进程,除了发现挖矿进程“xmrig”外,还有两个命名怪异的进程“diofiglos”与“cacascqw”。试着用kill指令绞杀挖矿进程“xmrig”,杀掉一个又再启动一个,无法消灭之。是不是有
作者:田逸(vx:formyz)创建多Ceph Pool的目的Proxmox VE集群上的虚拟机运行在高速磁盘NVME,而虚拟机附属的数据,则指定到低速、廉价、容量大的磁盘空间。为了高可用性,充分利用资源,需要让除Proxmox VE宿主二外的数据都运行在Ceph分布式存储上。 解决思路把高速的NVMe(或者其它固态磁盘SSD)多磁盘做成一个Ceph
作者:田逸 在我管控的项目里,有Proxmox VE集群,也有些单独的PVE。我打算把集群上的虚拟机、单机PVE上的虚拟机,都备份到同一个大容量存储。这样规划,即能有效利用资源,又能大幅度节省成本,同时也降低了管理成本。假使每个PVE都对应一个备份存储系统,管理成本增加不少。为保证备份数据可靠性,再增加一个存储,对备份数据进行同步,几乎万无一失。整体结构如下图所示,可供大家参
今天终于把Proxmox VE(简称PVE)从6.1版本升级到PVE 6.4版本,在Web管理后台对比PVE 6.4与 PVE 6.1,看新增哪些功能?在数据中心的菜单项里,多了一个度量服务器(Metric Server),中文显示“公制服务器”,翻译得怪怪的。 挡不住好奇,点进去看看,原来是添加远程数据统计服务器InfluxDB或者Graphite。 既然可以添加InfluxDB,那么在此基
作者:田逸(vx:formyz) 与NFS备份Proxmox VE上的虚拟机或容器相比较,PBS(Proxmox Backup Server)的效率要高很多,特别是备份速度。虽然如此,但我担心PBS可用性问题,万一PBS数据丢失,后果不堪设想。而用NFS做备份,则可用rsync把备份数据同步到另外一个系统上,从使PVE至少有两个异地副本。 昨天,把PBS从1.X升级到2.X,升级完后,在Web
现在手里有一个版本号为pbs1.0-1的系统,鉴于pbs2.0发布已经有一段时间了,于是就打算将其进行升级。 升级前的准备工作 准备工作主要有两步:备份重要数据及设置好升级源。 备份重要数据 PBS的重要配置文件位于目录/etc/proxmox-backup,其下包含配置文件、验证信息等,升级前最好对其进行备份,以防不测。 官方文档给出一条不太常用的打包备份指令,其内容如下: ta
----出自《分布式监控平台Centreon最佳实践》 Proxmox VE(Proxmox Virtual Environment)简称PVE,是一款能与VMware相匹敌的超融合虚拟化平台,其去中心化的特性使整个平台具备更高的可用性,因为没有控制中心,集群中的任意节点故障,都不会导致服务不可用。Proxmox VE 6以后的版本,几乎所有的管控操作,都可以在Web管理界面轻松完成,真是系统管理
---出自《开源分布式监控系统Centreon》 为准确掌握站点的可用性,可考虑用一个对象来同时检测Nginx、PHP及数据库的运行状态。基本思路是,写一个PHP文件,该文件的主要工作就是对数据库进行查询。当任何一个服务发生故障时,能通过HTTP状态码进行可用性判别。 在站点设定的目录下(也可以是站点的根),编写check_site.php文件,其内容如下: <?php $serve
作者:田逸(vx:formyz,mail:sery@163.com)终于等到pbs发布正式版本pbs1.0,迫不及待去官网下载好proxmox-backup-server_1.0-1.iso文件,将该文件放到我的proxmoxVE的iso目录,创建好虚拟机,并以pbs镜像文件作为引导磁盘(当然,也可以克隆成u盘或者dvd光盘在物理服务器进行安装)。前期规划备份至少要考虑一下几个因素:容量:评估好
作者:田逸(v**x:formyz)需求描述两节点物理服务器,外挂虚拟化后的共享存储(两台存储设备),存储通过多路径与物理服务器直接连接。网络划分为三个:数据网络、心跳网络及管理网络(远程控制卡)。工具组件包括:rhel7系统,pcsd工具包(包括corosync等),oracle数据库。高可用HA资源包括:虚拟网络地址(vip)、oracle监听器、逻辑卷资源(LVM)、文件系统(filesys
作者:田逸(formyz)问题描述某项目由两套proxmox组成,一套运行所有的应用程序,一台运行mysql数据库。为了保险起见,proxmox外挂共享存储,夜间对所有的虚拟机进行自动备份。备份是用的一台4U服务器,考虑到容量与成本,用了一台旧的4U服务器,插了好多慢速的sata盘,有效容量达超过35TB。项目上线后,前半年运行都还很正常,随着业务的增加,数据量跟着增长,特别是数据库的数量及大小。
问题描述 考虑到在山东移动机房租赁的物理服务器的存在单点,并时不时出现故障,导致业务停止,因此决定从物理服务器把某个老牌论坛迁移到可用性极高的proxmox超融合私有云平台。昨天夜里,兄弟们忙乎了一整夜,很是辛苦(我在11点对那些坏掉的文件系统进行修复,用screen仍在那里,自己睡觉去了)。 上午睡了个懒觉,还没清醒过来,有电话、qq消息过来了,说论坛页面能打开,详情页也没问题,但不能签到、发帖
现状 存在大量的单点问题:每个门店一个物理服务器,中心机房多个服务器。门店服务器故障,营业受影响;中心机房服务器故障,门店的非现金业务(银行卡刷卡、微信支付、支付宝等)受影响 总体思路 撤销每个门店的服务器,保证门店网络的可靠性(多线路接入、4G终端设备等),服务器集中到中心机房,构建更高可用性的数据平台。 基本目标 ü 高可用性:最小的停机时间,部分硬件损坏不对正常业务产生影响。 ü 可扩展
一大早就被电话吵醒了,云某项目数据库全挂了,启动不了(睡得太死,没听到报警短信),吓得不轻啊! 电话中说所有mysql数据库主库都启动不了,但从库正常,怀疑是主库去连其它阿里云的主库了。这些数据库,以前是从阿里云迁移到idc机房的,因此他有这个判断。 赶紧打开电脑,连***,登录其中一个数据库服务器,试着执行如下命令启动mysql服务 [root@bbsmysql121 backup]
老铁们都来看看,这就是所谓的高效云盘这几天,运营那边老报app卡顿,大量5**报错。通过排查,是mysql数据库卡住了,数据库错误日志看,有大量如下信息:企图修改数据库选项文件/etc/my.cnf相关的值,来消除问题,效果甚微,修改的两项如下:interactive_timeout=120connect_timeout=120 接着看系统的负载,用top指令,输出如下:Load飙升,I
作者:田逸(sery@163.com) 刚躺下,就收到proxmox虚拟机集群报警的邮件,顺便瞧了一眼,发现问题。磁盘空间满了,导致备份失败。仔细一看,备份目录为/var/lib/vz/dump,这个是本地文件系统的目录,但我以前设定的备份目录是外挂的nfs,空间大得很啊! 担心proxmox集群因系统根分区被塞满而影响整个集群的服务,毕竟所有的业务都从阿里云回迁到该超融合私有
没有安装盘,没有序列号,不知道应用,也能把数据连根拔起,迁移到可用性更高的proxmox超融合私有云。
本月初,受托前往大漠某供电局实施系统灾备。从烟台起飞,到呼和浩特中转,内蒙古范围内还要坐小飞机。等到目的地机场,是傍晚5点多,天黑了,这是小机场,偏僻,出租车都很少,用滴滴查看,周围几公里都无车可叫。正好看见一辆大巴(车其实很小,比中巴稍微大一点),管它呢,先上车。片刻,司机准备发车。由于天气太冷,居然无法挂挡,折腾好一阵,也不行。司机打电话求助,来了三个人,也没解决,看着时间,已经滞留了一个多小
作者:田逸(sery@163.com) Proxmox超融合私有云交付以后,存在一些有风险的操作,如果把控制权完全交给经验不够的人,很可能造成不可预料的后果。比如修改节点主机名导致集群崩溃、对ceph ODS不当操作导致ceph故障…。为了保证超融合的安全稳定,有必要对不同的用户进行有效授权。 Proxmox的权限,涉及到数据中心及虚拟机(没有针对物理节点的相关权限)。几个地方
超融合私有云产品说明超融合私有云定义 超融合是指将所有虚拟化计算资源(内存、cpu、存储、网络等)整合到一个物理设施,并且能够方便横向扩展容量。传统的云架构相比较,超融合私有云不需要借助外挂存储及光纤交换机。大大简化了架构,并节省大笔开支,同时也降低了管理难度。 超融合私有云特征 ü 高可用性--数据更安全任意部件甚至部分物理主机故障,都不会影响运行其上的
巧删30多万个无用app包因为审查的原因,大量的app包需要删除。这些包位于不同的目录下,不能直接清空目录,因此要删除这些文件,还是比较麻烦的。有关部门给了一个完整的删除列表,我检查了一下,共有324130,这些文件小的几个KB,大的数百兆。起初我吩咐小弟去干,干了一阵,反馈说文件太多,rm不起作用。我抽空去看了一下他写的脚本,内容截取如下:[root@sdyd163del_soft]#more/
作者:田逸(sery@163.com)这几天一直忙着往proxmox集群里边迁移服务,进展还是比较顺利。通过整合资源,两个机柜的服务器,下架以后,就剩一个柜子了,后边再迁移一下,还能下架一些旧的配置低的服务器。因为机柜电源的限制,迫不得已还得下架一台有公网ip的旧服务器。为了保证可用性,临时在一台有redis应用的服务器上绑定了一个公网ip。然后开始部署keepalived及haproxy,但搞半
作者:田逸(sery@163.com)使用nfs的目的Proxmox集群中,如果将ISO文件存储于本地,只能供本节点存取,要用于集群的其它节点进行安装,将无法如愿。现已经在物理节点pve48的本地存储上传了可以使用的ISO镜像,接下来,试着创建虚拟机,用此ISO镜像来安装虚拟机操作系统。此虚拟机创建在集群中另外一个物理节点pve50上,随便给其命名进行测试。这样有些麻烦,如果要在每个节点给虚拟机安
系统出了故障,第一个挨板子的就是运维人员。不管任何原因,先找运维,给他一口好锅。运维好苦啊!稳定运行时,似乎是多余的存在;有问题时,要替人背锅。与其被动,不如主动一点,不做背锅侠!怎么做呢?先看几个例子,亲身经历。
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号