系统集成论坛

标题: 鸟中人大哥——网管的工作日志模版 [打印本页]

作者: yezi    时间: 2013-1-10 17:00
标题: 鸟中人大哥——网管的工作日志模版
网管的工作日志模板
工作日志对网络管理员来说,是非常重要的文件。任何一位有良好习惯的管理员,每天例行工事之一就是要整理网管日志。
哦﹐很久没做 report 和 log 了﹐下面是小弟刚到某公司第二周的‘工作报告’和‘事件汇报’﹐或许可以给您参考一下﹕
~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ *


本周主要工作和进度﹕

1﹐继续对公司网络结果探测﹐已经延伸至 3 楼。初步完成。
2﹐修改 12 楼之物理网络图。已完成第一版。(请参考附件 1﹐kh_phy.vsd)
3﹐绘制 12 楼之逻辑网络图。已完成初稿。(请参考附件 2﹐kh_logi.vsd)
4﹐继续修改《PC Information Sheet》﹐并以此为基础设计出《Server Information Sheet》。基本完成。(请参考附件 3﹐KH Server Information Sheet.doc)
5﹐对 miao 和 whale 两台服务器进行设定文件记录。初步完成。(请参考附件
4﹐ks_conf.doc)
6﹐草拟公司《网络安全原则》。部份完成。(请参考附件 5﹐net_policy.doc)
7﹐草拟《网络使用者指南》。仅开头﹐须等《网络安全原则》完成始能继续。
8﹐常务事件处理及技术支持。基本上得以解决。(请参考附带文件 6﹐events_wk02.txt)


----------------------------
原计划中没有实行之事务和原因﹕

1﹐对所有 PC 进行数据记录。
从(某某上司)处得知目前 PC 部份无需管理﹐所以目前仅就 miao 和 whale 主机进行了记录。

2﹐如有可能﹐会对目前使用者账户做一些整理。
目前看来似乎没有此必要性﹐待空闲时再考虑处理。


--------
下周计划﹕

1﹐主攻《网络安全原则》的草拟。
2﹐继续草拟《网络使用者指南》。
3﹐修改 3 楼之网络图﹐包括物理和逻辑的。
4﹐绘制高雄总部的网络逻辑图。
5﹐完成服务器的设定文件记录。
6﹐如有可能﹐会对目前使用者账户做一些整理。

----
建议﹕
1)
首先多谢(某某上司)这星期来的指点和照顾。让弟得以顺利展开工作﹐并同时增进了对公司人事﹑及网络情况的了解。

2)
请抽空审查 12 楼网络之物理和逻辑两图﹐请纠正任何不实之处。(必要时﹐可以对原文件进行修改。它们都是用 Visio Pro 5绘制的﹐如果您用的版本较新﹐修改后请注意版本兼容情况。)

3)
请抽空审阅“ Server Information Sheet ”﹐对不必要之项目﹑或需增加项目加以指示。

4)
服务器设定档案记录主要是目前机器上面的档案的拷贝﹑和某些命令的执行结果。或许尚有未包括的文件。如果发现有任何错误﹐或建议﹐请尽早指示。但考虑到该文件的长度﹐回复可以暂缓。

5)
请检查“events_wk02.txt”(附带文件5)中关于服务器的修改﹐如果发现有错误的步骤或错误的更改﹐请给予修正指示。尤其是2000/06/09 事件 2 中关于 DHCP 的建议﹐请考虑一下。

6)
请仔细审阅《网络安全原则》一文﹐如果发现有任何需要改进的地方﹐一定要提出﹐好及早纠正。假如您觉得文章方向有偏颇﹐请提出指示。该文件目前仅为草稿﹐在定稿之前﹐一定要呈交总经理或相关行政领导人审查﹐并获得通过方可发行。如有可能﹐还要咨询公司之法律顾问。

7)
根据目前所草拟之《网络安全原则》﹐除了《网络使用者指南》外﹐我们尚需要《网络服务管理规程》。它的内容应该包括﹕
7.1网络运作之服务标准(即何种服务可以运行﹐以及运行的服务等级﹔何种服务需要禁止﹐以及禁止等级)
7.2服务器之架设标准(例如硬件要求﹑软件要求﹑平台﹑版本﹑授权证书范围﹑指定或非指定机器﹑等等)
7.3服务器服务的安装步骤(最好为 step by step的安装﹐除了可以让相关人员在事故重建中得到标准外﹐对任何接手人员都可立即上轨)
7.4网络的稽查原则(包括记录文件的配置和存放﹑人员的指定﹑排程﹑等等)
7.5网络备份原则(硬设备﹑安装﹑服务范围﹑人员﹑排程﹑等等)。另﹐在《网络安全原则》中有提及到网络使用者的备份服务﹐是否必要﹖和哪些人员需要﹖
7.6网络监控和警备原则(设备﹑手段﹑要求程度﹑人员﹑预警临界界定﹑上报渠道﹑等等)由于弟对公司网络架构不熟﹐而且说老实﹐也未能胜任技术要求﹐尤其是服务器﹑路由设备和网络监测等方面。所以﹐以上第 7 点的内容我想最后还是请您撰写。

8)
根据目前所草拟之《网络安全原则》﹐我们会对远程访问服务加以限制。但弟不是很清楚公司目前或将来会否提供远程访问。以及它的安全要求是什么﹖请作出指引。

9)
根据目前所草拟之《网络安全原则》﹐公司也会监管因特网的访问﹐其中会包括站台过滤和 anit-spam机制。不知道是否可行﹖如果有此需要﹐其设定指南也应该包括在《网络服务管理指南》中。

10)
根据目前所草拟之《网络安全原则》﹐公司会要求所有工作站安装放病毒软件﹐不知道公司对此的规定如何﹖

11)
基于前述﹐弟对许多规定还相当模糊﹐目前在《网络安全原则》所提议的﹐大部份为“杜撰”﹐实在不知道其必要性和可行性。如果您觉得有探讨的余地﹐请给予指示。


~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ *

下面为当周日志﹕

~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ * ~ *


----------
2000/06/09


1)10:30am

问题﹕
根据文彬之报告﹐他的主机不能用 smtp.xxx.com 主机寄信给非本公司的地址﹐同样用smtp.ks.xxx.com 主机也不能。均遇到 "not relaying" 的问题。

测试步骤﹕
1﹐到文彬的计算机输入 hostname 得到其主机名称为﹕conquer.xxx.com﹐ ifconfig |grepaddr 得到它的 IP 为 192.168.20.128
2﹐检查文彬的邮件软件(netscape, linux version)之sender address 为conquer@xxx.com﹐将之加进 "reply to" 也同样遇到相同问题
3﹐telnet 至 smtp.ks.xxx.com (211.xx.xx.76)﹐查看 /var/log/maillog 发现关于conquer 这个 sender 有这样的叙述﹕"relay=IDENT:conquer@[192.168.20.128]"

推测﹕
看情形似乎是 sendmail 不能够反查询文彬的主机。在 sendmail 8.9.x 已经不开放任意 relay 的情形下﹐sendmail 要接收一封转寄邮件的时候﹐必须反查询 sender 的主机地址。这动作可以经由 hosts 檔或 DNS。

修正步骤﹕
1﹐cat /etc/host.conf 确定其order是 hosts,bind
2﹐cat /etc/hosts | grep 192.168.20 并没有发现任何记录
3﹐nslookup 查询 conquer.xxx.com 并没有结果﹐set q=ptr 后查询 192.168.20.128 也没结果。
4﹐至此应该确定是反查询的问题了。解决方法有三﹕
4.1 为192.168.20 建立反解 DNS﹐同时更新 xxx.com 的正解以将 R/D 的主机加进去。但考虑到 DNS的对外开放性。在这台允许直接外部联机之 DNS 主机上透露过多内的部网络信息﹐实在是非常不明智的行为,不应该考虑﹐除非在内部网络建立独立的 DNS 主机。但这样牵涉到目前的网络架构问题。相信目前是难以实现的﹐就算必须这样做﹐也应该向上头申请获批准方可实行。
4.2 将文彬计算机用 hosts 静态对应。但这样做的话﹐其它在 192.168.20 下面的主机也要这样做﹐实在太麻烦了。
4.3 修改 /etc/mail/access 文件﹐将文彬主机的 IP 加入。但和前一个理由一样﹐这样做必须为每一台主机建立RELAY﹐有点麻烦。倒不如将整个 192.168.20 网加入﹐不过考虑到其它的本地网络﹐或许他们将来也会用到本机器做 mail relay﹐所以决定将整组 192.168 加入。虽然范围过大了﹐不过“相信”这个 reserved privateIP 网络应该不至于让目前 server 成为 ineternet 上面的 spam 基地吧。
5﹐最后 su 为 root ﹐修改 /etc/mail/access ﹐将 "192.168 RELAY" 加入
6﹐重新启动 sendmail ﹕ /etc/rc.d/init.d/sendmail restart﹐确定有两个 'OK'

结果﹕
对外邮件传送成功。


2) 11:10am

问题﹕
接到(某某上司)来电﹐得知 Jenifer 之计算机无法使用邮件。

检测步骤﹕
1﹐尝试下载邮件﹐或得 " can not connect to server" 的回应
2﹐在 command prompt 输入 'winipcfg' 竟然没有此命令﹐原来这是 windows 2000 的机器﹐改为输入 ipconfig /all。发现这台主机竟然使用从一台 IP 为 192.168.23.48 的DHCP server 分配下来的IP﹕192.168.23.101 ﹐而它目前并没有获得 DNS 的设定。
3﹐输入 ipconfig release 后接 ipconfig renew ﹐IP 并没有改变。

推测﹕
可能在同一物理网络上有其它主角正扮演着 DHCP 角色﹐这应该和目前的网络设计有所出入。更糟糕的是﹕这台 DHCP server 并没有为 clients 指定 DNS 内容﹐这恐怕是连不上mail server 的主要原因。跟着接到(某某上司)来电﹐和他讨论的结果基本上和上面推测一致。他建议查询一下 R/D 部门是否有哪一台计算机不小心启动了 DHCP 服务。

修正步骤﹕
1﹐出来刚好碰到丰荣﹐在问他的时候﹐旁边的志全则回答说﹕那台 DHCP 已经关闭了。经检查发现是 CIH 的机器。
2﹐然后回到 Jenifer 的机器﹐重新执行 ipconfig /releas 和 ipconfig /renew 就成功抓回 192.168.16.x 之 IP ﹐且 DNS 也指定为正确的 211.72.41.76

结果﹕
邮件收发恢复正常。

附注﹕
1﹐在同一时间内﹐分别收到 3 楼和惠珍的报告﹐经检测发现都是同一 DHCP 原因引起。在Windows 98 上面﹐输入 winipcfg 再用“全部更新”将之修改过来就没问题了。
2﹐经检查目前 192.168.16.254 这台 DHCP server 之 /etc/dhcpd.conf 档﹐发现﹕
default-lease-time 3600;
max-lease-time 7200;
似乎短了些。这样除了会做成过多的不必要 dhcp 广播封包和续约封包外﹐也容易让做出clients租约容易过期。其时如果有人不小心启动了另外一台 DHCP 的话﹐在 client 重新发放dhcpcover 的时候﹐会很容易出现今早的问题。有鉴于此﹐我将 /etc/dhcpd.conf 设定改为﹕
default-lease-time 259200;
max-lease-time 777600;
分别是 3 天和 5 天。相信这会比较合理些。并重新启动 dhcp ﹕'/etc/rc.d/init.d/dhcpd restart'

建议﹕
经此一事件后﹐我觉得 R/D 和 I/A 部门的网络和办公室网络﹐至少要在物理连接上面应该分开。我们可以在 gateway 上面多加一张网络卡﹐然后用独立的 switch / hub 来连接R/D﹑I/A﹑或是办公室网络。这样在安全上面﹐或是在网络之稳定性﹐都会有所保证。又或者将他们的测试网络独立出来﹐用火墙将所有危险封包拦下来。
不过﹐要更改目前的网络设计﹐一定要向上面申请﹐必要时还要上面来设计。这个等下周报
告再提吧。



-----------
2000/06/14

1) 08:15am
问题﹕
内部网络不能联机之外面 internet 。

检测步骤﹕
1﹐尝试 ping 外边网络﹐如 www.hinet.net ﹐可以 resolve 到 IP﹐但 ping 没反应。
2﹐尝试 ping smtp.xxx.com 竟然连 IP 也 resolve 不到。
3﹐telnet 至 miao (gw)﹐重复上两步骤﹐结果一样。
4﹐执行 traceroute 168.95.1.1 (hinet DNS)﹐得到结果如下﹕
traceroute to 168.95.1.1 (168.95.1.1), 30 hops max, 38 byte packets
1 211.72.41.73 (211.72.41.73) 0.869 ms 0.821 ms 0.740 ms
2 * * *
3 * * *
4 * * *
[aborted]

5﹐发一封邮件至 @xxx.com ﹐只能用 kh 的 smtp ﹐但使用 smtp.xxx.com 则不行。
6﹐执行 nslookup ﹐发现只能查询 cache 中的记录。其余的一概不通﹐连 smtp.xxx.com
也查询不到。

推测﹕
可能是 router 的问题。

修正步骤﹕
1﹐马上用 email 通知(某某上司)﹐等他上班后再致电他。
2﹐没联络上(某某上司)﹐却找到(另一上司)﹐他建议找 hinet 报修。但由于不知道 ADSL的号码﹐几经周折最后找到成章﹐原来号码是 55xxx26。
3﹐拨112找中华电信报修﹐等待回话。
4﹐10:40am 接到中华电信来电﹐说网络已经修复。

结果﹕
网络恢复正常。


-----------
2000/06/15

1)09:50am

问题﹕
再次接到三楼投诉关于 DHCP 的问题。情形和上次一样。

推测﹕
可能又是 CIH 的机器之 DHCPD 又跑起来了。

修正﹕
1﹐直接找 CIH 查询﹐但他不在。
2﹐因为机器的 console 处于开启状态﹐所以输入 ps ax | grep dhcp 发现果然在跑。
3﹐用 kill 将之杀掉了。

结果﹕
回复三楼映善 dhcpd 已经关闭﹐请他重试。未能实质性确定问题之解决﹐相信没有进一步的投诉应该没问题了。

备注﹕
因为该事件已经发生第二次了﹐我认为有必要以非口头形式警告错误启动网络服务以致干扰正常网络行为的当事人。查证该服务是在 CIH 之机器被执行的﹐虽然没有直接证据显示是 CIH 本人之故意行为﹐但还是有必要给 CIH 一封 email 陈述原因﹐以防类似事件重演。 email 内容如下﹕
---------------------------------------------
FROM﹕ Kenny Chen﹐ 网络事业部
TO﹕CIH﹐ 硬件事业部
Subject: DHCP service

Hi CIH 兄您好﹕

今天早上 09:50am 接到高雄总公司 3 楼陈映善兄的电话报告﹕他们有些 DHCP 客户主机再
次被 192.168.23.48 这台主机错误分配到 192.168.23.x 的 IP 去了。经查证 192.168.23.48 这台主机是您目前使用的机器。因为当时您未在场﹐所以弟私自将hdcpd 的服务关闭了。仅此知会。
由于相同事件已经于一个星期内第二次发生﹐且干扰了公司目前网络的正常运作。兹请求您控制好贵主机﹐以免错误启动可能影响公司正常网络的任何网络服务。
如果您已经将相关服务关闭(包括从开机程序或其它自动启动服务中移除)﹐并确定将来不会再次发生影响公司网络的事件﹐您可能忽略以上请求。假如您需要我们的协助﹐可以直接与本人联系。
让我们为维护一个安全高效的公司网络环境共同努力﹗
祝﹕工作愉快﹗

Regards,
Kenny
网络事业部
---------------------------------------------


2) 10:55am
问题﹕
接到硬件事业部那边关于 Windows 打印的问题报告。

检测﹕
情形和之前的状况一样

修正﹕
按 2000/06/02 事件1之解决方法修正。

结果﹕
打印正常
作者: hongtailang    时间: 2013-1-20 13:15
辛苦辛苦
作者: tmore    时间: 2013-1-25 17:27
我觉得很不错,思路清晰完善
作者: haole890208    时间: 2014-3-9 00:44
学习了
作者: h163plus    时间: 2014-4-25 19:41
学习,逻辑思路相当清楚...




欢迎光临 系统集成论坛 (http://bbs.xtjc.com/) Powered by Discuz! X3.1