项目角度:
遇到的问题:
1、 4月10号出差第一天,发现的第一个问题是ICG主控板的万兆口收不到客户核心交换机镜像过来的流量。
经过对比itm测试,同样发现万兆口收不到流量,但是把客户的核心交换机流量镜像到千兆口,再到itm千兆口,就可以正常接收流量。可以说明icg主控板、itm的万兆口无法接收客户的流量,之后将流量镜像到itm的千兆口并在设备底层抓包发现客户的流量全部是pppoe+vlan的流量。到此可以知道icg万兆口收不到流量是因为交换板把所有带标签流量过滤掉了。4月11号晚上,梁一帮配置了交换板,使所有流量都可以被正常转发,之后icg可以正常收到流量了。
这个问题开始没有找到原因是因为我和售前技术跟校方还有H3C工程师确认了多次,得到的回复都是流量没有vlan。但是我没有去itm底层抓包,如果一开始就抓包一定能找到问题。
2、 9000机型7.1.0版本装上ipv6补丁包之后,设备会报错。
9000-20的两个主控板开始都是7.1.1版本,之后我reset了一个主控板到7.1.0并装上了ipv6的包,由于串口不能用,我用显示器连出的设备底层,发现此时设备每隔一段时间打印若干段错误信息:
重启系统、reset设备之后依然打印这些错误,最后重装了系统。第二个主控板我在4月14号周一的时候也reset到7.1.0并再次装ipv6的补丁包,之后出现了同样的问题,最后重装了系统。
3、 设备crash,设备无法启动
其中一个主控板在大流量运行的情况下(单icg主控板3g流量),界面操作设备(配置策略、立即生效等)时造成设备crash,并产生了crash日志,原因不知道。
另外一个主控板出现过无法启动的现象,也是大流量情况下界面操作导致设备死机了,之后再也进不去系统,最后我重装了。
4、 实时监控流量从2.5G左右跳到600M左右
客户流量正常情况下6G,一个icg主控板正常有2.5G左右流量,但是正常运行几分钟之后就会变到600M,这个时候发现网卡也不丢包,网卡统计流量也在600M左右。第一次发现是4月14号周一早晨,发现设备流量前一天晚上6:50左右突然从2.5g跳到了600M,之后重复复现了很多次,重新配置网络(点击网络配置中的确定)会暂时恢复到2.5g,一段时间之后又再次下降到600M。之后关闭了icg的网卡自协商,但是还会出现这个情况。目前还不知道原因。
5、 设备重启时网卡排序会发生变化
每个icg主控板有2个万兆口,6个千兆口,曹3中的主控板重启之后网卡排序会发生变化,2个万兆口从eth6、eth7变到eth0、eth1,再次重启之后又会变回去,设备机型是atca-6100,但是/usr/sbin/下没有eth-pciid-atca-6100.ini这个网卡排序文件。
6、 软件dispatch分发丢包
主控板drop掉udp之后,网卡上的流量已降低到600M左右,此时软件dispatch丢包很快,5%左右,造成审计漏审严重。之后瑞娟调了dp_mg_ct模块中的一个参数/proc/sys/net/disp_n_merg/dp_queue_max_len,从256调到4096,这个时候正常情况下丢包到了万分之一,漏审情况好很多。但是流量高峰的时候,13g流量,此时dispatch丢包又非常严重。
7、 邮箱、发帖审计漏审
测试时发现有漏审计情况,猜测原因有俩,1、镜像丢包,流量到icg之前已经丢一部分,造成连接不完整,已经抓包验证了同一个tcp连接在拨号的pc上抓到18个包,但是icg上只有13个包;2、软件dispatch丢包。
后续行动:
1、 ipv6的包对9000系列设备支持需要重新测试;
2、 9000系列设备的网卡排序文件最好可以加上;
3、 设备crash的原因能否找到(crash日志瑞娟有看过,我没有拷贝回来);
4、 复现流量从2.5g自动跳到了600M的现象,再找原因。
个人角度:
存在问题:
1、 第一次出差比较紧张,遇到问题的时候想的第一件事情是消除问题,而没有冷静下来分析问题原因,造成问题判断错误,知识的缺乏造成无法依靠自己分析很多现象。
2、 没有及时做好每天的工作总结,项目进展记录。每天只知道遇到问题之后想方设法先把设备弄正常,没有及时记录下重要的线索与操作,造成后面总结的时候记不清时间、操作了。
改善:
1、 加强自己知识储备,遇到问题先仔细分析,再做出判断;
2、 认真做好工作记录,对后续的工作很有指导作用。
第二篇:出差总结 (1)
出 差 总 结
—采集中心
出差时间:20xx年11月8日—20xx年11月23日(共15日) 出差地点:贵州省凯里市
出差线路:成都—贵阳、贵阳—凯里
出差行程:
11月8、9日 成都—凯里
11月10日 上午设备没到达凯里;下午设备到达,到凯里市社保局检查设备,搭建设备。
11月11日 到社保局进行采集工作。组内分工合作,主要工作就是操作电脑监控采集图片质量,和负责采集口令引导被采集者拍摄,协助完成正确的采集动作。
11月12日 到社保局进行采集拍摄工作。
11月13、14、15日 在华联厂进行采集拍摄工作。
11月15日 下午打包设备,搬到华联厂老年活动中心进行采集工作。
11月16、17日 在华联厂老年活动中心进行采集。 11月18、19日 去101地质队进行采集。
11月20、21日 在地质六队进行采集。
11月22、23日 凯里—成都
采集情况总结:
采集工作是两个人一个小组来完成,主要是其中一个人负责操作电脑,监控拍摄的图片质量是否合格,和被采集者的动作规范与否;另一个人负责采集口令,引导被采集者正确的拍摄。我负责的主要是采集口令部分,来协助被采集者正确完整的拍摄。本次出差的目的是到贵州凯里完成2000个人的采集任务,根据采集标准拍摄规范质量合格的图片,保证采集的数据有效可用。
工作过程中出现了以下的一些问题:
1、11月11号在社保局开始第一天采集,由于社保局人员工作安排很紧凑,没有时间过来采集,所以在社保局进行的两天工作,采集的对象只有很少一部分人。我们每一天都要保证能够采集一定数量的人数的出差时间有限,由于社保局没有足够的采集源,最后重新找了采集源,转去了华联厂进行正常的采集工作。
2、采集过程中手机和平板会出现掉线和卡顿的现象,还有工控机无法启动的情况,每次需要停下来检查问题,拍摄过程中耽误了一些时间。经过多次对设备的搭建检查和在操作过程中发现的问题,找到问题存在的原因。发现在操作电脑时不能过多的去点开图片,还有工控机不能同时满足五个摄像头的使用,出现问题需要重启调整软件。
3、采集过程中有一些老年人年龄太大,身体不好,首先拍摄时背没办法抻直,身体无法自如挪动,对于根据指令做动作造成了很大的困
难。出现了拍摄的图片切下巴或者出境的废数据。其次,就是一些老年人耳朵听不到,对于耳朵听不到的老年人就是耐心的用手势来指引他们去拍摄,给他们做示范动作来完成完整的拍摄。
4、在采集过程中一些采集对象要求出示工作证,由于没有佩戴工作证所以一些采集对象不配合工作。经过多次讲解我们工作的性质和采集图像的用途,最终完成了采集。
这次出差收获了很多,譬如拍摄过程中电脑反应慢,手机出现卡顿等一些问题,遇到这些问题要冷静处理找出问题。工作中出现的某些问题是人为无法避免的,在遇到这些问题时要细心仔细的检查问题所在,最终才能快速解决问题。还有在平时的工作中应该学会观察,会发现身边的每件事情上、每个人身上都有很多值得我们学习的东西。这次的出差更加让我意识到团队合作的重要性,工作是需要每个人共同合作完成,所以在工作中团队配合很重要,需要每个成员的积极参与。这次的出差工作对于采集老年人来说困难较多,工作过程中需要更多的耐心和责任心。工作过程中会有很多意想不到的突发状况发生,要懂得随机应变,适时变通。结合实际工作经验,不断学习提高,充实完善自己。
20xx年11月27日