目前运维的工作范畴

这里总结一下运维工作范畴

要让一切变得清晰, 可见, 高效

一、 资源管理

  • 域名管理: 域名购买, 续费, 解析等
  • 主机管理: 主机购买, 续费, 迁移, 注销等
  • 账号管理:

    • 域名服务商账号
    • 主机服务商账号
    • 主机账号
    • webmaster账号
    • 工具站点账号

二、 服务监控

  • 网站是否正常运行: 网站是否能正常提供服务
  • 服务是否正常运行: 电子邮件系统是否正常
  • 服务器健康状况: 负载情况, 内存状况, 磁盘状况, cpu状况

三、 安全防护

  • 网站防火墙的规则, 以及定期的检查
  • 使用工具定期对网站进行安全扫描
  • 合理配置权限

四、 日志分析

  • 合理的采集和切分网站日志
  • 通过 ELK 分析网站日志
  • 检查防火墙规则, 观察 client 被 ban 的情况
  • 安装 pwiki 日志工具, 可视化的分析网站的访问情况

五、 服务部署

  • 目前人工安装所有服务, 比较低效, 希望能够尽可能实现自动化,尤其是对于通用环境。
  • 探索 docker 对于我们的业务部署是否有价值和意义,多看一些相关的资料
  • 探索 jenkins 工具, 对于我们的业务部署,日常代码上线是否有价值和意义,多看一些相关的资料

六、 脚本分发

  • 熟练使用 ansible , 便于通过一台机器管理多台机器
  • crontab 的管理, 日志的分析: 脚本要有输出, 输出要有采集, 采集要易于查看
  • 数据备份日志分析: 脚本要有输出, 输出要有采集, 采集要易于查看

七、 SEO工作

  • 理清 SEO 工作范畴: 制作网站, 制作页面, 上线网站, 更新网站, 提交 sitemap
  • 理清 SEO 工作流程, 脚本, 工具, 部署的要求。
  • 理清 SEO 工作标准, 如何测试, 检查。

八、 做好总结工作

  • 每次对服务器做了变动和修改, 需要记录日志: 某月某日, 做了什么事情
  • 每次服务器出现异常, 需要分析清楚原因, 并提出改善的方案
  • 尽量避免误操作, 一旦发现误操作, 应当总结反思, 避免重蹈覆辙
添加新评论