月度归档:2017年01月

祝愿你的2017年,一点都不像2016年

去年4月(此刻,已到2017年,所以是去年),我尾随好友兼合伙人吴炳锡,也辞职了。我们一起合作发起了“知数堂”这个在线培训品牌,立志打造圈内最有良心、最有品质的品牌,当然,我们现在离这个目标还远的很,但我们一直在努力。

这将近一年以来,也受到各种各样的机会诱惑(或者说干扰),比如合作,比如投资,比如是否要开线下实体课程等等。我个人是比较谨慎保守的,而且之前定下的目标是,无论如何,先自己折腾一年看看能做成什么样再做打算。现在回头来看,我们做的并不算出色,但知数堂依然获得了大家的肯定,也有了很大突破,我们的学员遍布全球各地华人区,众多优秀学员分布在互联网、集成商、电信、银行、制造业、物流等各个行业,包括腾讯、淘宝、京东、乐视、去哪儿、滴滴、猎豹、58、微博、金山云、聚美、苏宁、恩墨、沃趣、爱可生、东方龙马、37玩、宝存、人人贷、中移动、顺丰、德邦、美的、新东方、平安金融等众多知名企业。截止当前,也超过10位学员通过了MySQL OCP认证,对我们而言,都是令人非常欣慰的成就。

在对外合作或投资这件事上,如果只是维持现状并有小动作的话,我们并不算缺钱,更多的是缺乏品牌建设以及市场营销能力,这可能也是大多数技术出身创业者的短板吧。不过这也不完全是坏事,正因为如此,我和吴炳锡老师才能更专注在我们课程质量以及学员配套服务建设上。

对我而言,2016是如此的重要,这一年,我下定决心走出来自己做,老实说压力还是很大的,不管是经济压力,还是工作压力,当然更多的是时间压力,一天就24小时,如何有效利用这点时间,并做着自己不擅长的事情,像做文案、P图、写通告、十分粗糙的营销等等,以前不用操心的事情,现在神马鸡毛蒜皮的事都得管、都得做,估计幸好在坚持跑步,才没那么快长白发,哈哈。

说到跑步,2016年相比上一年跑的少了,所以几次参赛的成绩都不太理想 😓

知数堂之外,我还兼职卖老家的铁观音茶叶。承蒙圈中各路朋友不吝支持,今年整体卖的还不错,尤其是下半年拿到一批好货,就在上周,已经全部售罄,识货的朋友都叫好,还想再来点,可惜已经缺货。好茶就像好机会,不抓住这波,可能就至少要再等一年,而且还不能保证同样价位的茶叶口感、档次完全一样,但,老叶茶馆会秉承和知数堂一样最有良心、最有品质的品牌目标为大家伙找到靠谱的茶叶。我还梦想着有一天,能靠卖茶叶养家,不再做苦逼的IT技术男。

一句话,想要靠谱的MySQL、Python培训,以及靠谱的铁观音茶叶(明年开拓红茶等其他品类),请来找知数堂培训/老叶茶馆,您就放心好了

2016年我还轮值主持了ACMUG的活动规划,今年我们跑了深圳、武汉、北京、厦门、上海,最后又回到北京。经过几次活动建设,使得ACMUG的影响力达到空前。当然,这是整个主席团的集体努力还有赞助商、合作伙伴、志愿者们的共同付出,不是紧靠一两个人就能做好。2017年,我们将继续传播开源,传递快乐,倡导向上、开放、友好的理念。

另外,我在2016年还搞定了2套房子。别想多了,当然都是有贷款的哟,一个是收新房简单配置家具家电出租了事,一个是买二手房用于将来娃娃读书用(也就是学区房😭),还好这个学区房环境不错,挨着2个公园,平时跑步锻炼非常方便,超值了。

自从我和吴炳锡老师一起经营知数堂,把她从“某个不知名的培训机构”打造成在圈子里还算略有名气的品牌。在做这些事的过程中,我也开始特别关注非技术之外的事情,包括营销文案等方面。如果您对这个也有兴趣,推荐关注:李叫兽、小马宋等。总之,会更加关注一些新鲜的事情,也会尝试向90后、00后那一代人学习,毕竟这个社会未来属于他们的。当遇到60后、70后说我们是垮掉的一代时,努力创造属于我们的成绩就可以,别的不用太在意。一句话,开心就好

2016年很精彩,大家都在抓黑天鹅、跟热点事件,我则总是慢半拍,慢热型的,也不太擅长炒作自己或标新立异,更多的是埋头做事,这算不算也是一种匠心精神呢,哈哈。

明年是农历鸡年,也是我的本命年,希望在新的一年里,能继续做好知数堂,为技术圈培养更多可靠的人才,也能卖出更多茶叶 O(∩_∩)O哈哈~

新的一年里,我最大的目标只有一个:全程马拉松能稳定跑进4小时30分,也就是从跑渣渣晋级到跑渣,嘿!

最后,祝愿各位的2017年,一点都不像你的2016年

今天你检查备份了吗?

0、导读

《炉石传说》游戏数据库回档事件反思

本文约900字,阅读时间约5分钟。

今天引爆各大技术群的事情就是网易游戏《炉石传说》游戏数据库发生宕机并引发数据丢失事故,最终决定回档并后续补偿玩家损失。详情可见官网公告:http://hs.blizzard.cn/articles/16/8565

我以前也在搜狐畅游(http://www.changyou.com,NASDAQ:CYOU)负责游戏数据库维护,也遇到过因为服务器故障最终导致回档的事故,不过都没像这次炉石搞这么大动作。在这里我并不想借机调侃消费他们或搞营销,只想和大家一起聊聊作为DBA,应该注意哪些事。

我们从公告的内容中,我们看到了几个问题:

  1. 公告发布时间是2017.1.18 18点,决定回档到2017.1.14 15:20,中间这段时间难道一直都在尝试恢复数据库,就不能快速做出决策尽快直接回档吗,这是在考验游戏玩家的耐心,很容易引发玩家的“群体事件”;
  2. 因为供电意外导致故障,并造成数据库损坏,如果也用MySQL数据库的话,看起来应该是没开启双1设置,并且有可能还在使用老式的锂电池BBU。所以断电后很容易导致阵列卡cache中的数据丢失,数据库也跟着损坏,以前没少才踩这个坑;
  3. 连备份数据库也发生故障,有点不可思议,这样就容易让人产生是人为事故的联想了。不过,我多年前也发生过类似的情况,不过那次是因为用mysqldump备份时指定了错误的字符集,并且在做备份恢复测试时没严格测试数据的有效性,致使发生故障时不能正常恢复,结果也悲剧了。作为不了解内情的局外人,只能以官方公告为准,无要无端臆测;

关于服务器可靠性以及数据库备份,有几点建议:

  1. 必须定期全备,并且优先推荐物理备份,逻辑备份通常相对更慢。一般至少每天一次全备;
  2. 每小时一次增备或差异备份,我以前的做法是开binlog,并且利用last_update_time列特征每小时做一次差异备份。这样我要恢复的话,一般最多只损失不到一个小时的数据;
  3. 备份文件务必进行恢复测试,如果有多个备份集,可以采用随机抽取的方式做恢复测试,但一定要保证所有实例的备份最终都会被验证一次;
  4. 必须监控服务器硬件健康状况,包括CPU、内存、阵列卡、阵列卡电池等部件,以及服务器温度等。我们曾经有在哈尔滨及西安某机房的服务器,一到夏天就很容易因为温度过高而引发自动重启😓😓 我们的解决方案就是利用监控,提前预警,及早通知机房打开机柜门并且安排散热,比如很low的放着风扇对服务器吹啊吹 😓😓

快过年了,做运维的同学应该也都差不多做完全服巡检了吧,先祝大家春节快乐,鸡年吉祥,新的一年服务器宕机率减少99%😄😄