<div style="line-height:1.7;color:#000000;font-size:14px;font-family:Arial"><div>>Hi all,</div><div>>        Last week I report an issue about "ods-signerd thread abnormal running" , after got Yuri's reply then I version up my test env's opendnssec to 1.4.9 , but with 3 days test it's still not work.</div><div>>        The signerd thread will disappear , I tend to think this is a major issue .</div><div>>        Some parameters about my test env list :</div><div>>            CUP : 14</div><div>>            Mem : 128G</div><div>>            General load average: 5.50, 4.43, 4.04</div><div>>            Zones : 20</div><div>>            Per zone RR count : 660,000</div><div>>            Total zone RR count : 13,200,000</div><div>>            Per zone RRset increasing speed : 1000/1h/zone</div><div>>            opendnssec version : 1.4.9 (1.4.7 last week)</div><div>>        And this machine just run 2 bind and opendnssec . Mem total cost less then 30G . </div><div>>        I don't know why always got error as "wire/notify.c:477: notify_handle_zone: assertion notify->handler.fd == -1 failed" .</div><div>>        Did anybody have met this like me ? How do you solving this ?</div><div>>        I start the opendnssec about at 1 PM ,  I grep some system log as below : </div><div>><span class="Apple-tab-span" style="white-space:pre">          </span>Mar 30 13:51:39 p01-test-devops-9-81 ods-signerd: [socket] unable to handle outgoing tcp response: write() failed (Broken pipe)</div><div>><span class="Apple-tab-span" style="white-space:pre">          </span>Mar 30 13:53:23 p01-test-devops-9-81 ods-signerd: [socket] unable to handle outgoing tcp response: write() failed (Broken pipe)</div><div>><span class="Apple-tab-span" style="white-space:pre">          </span>Mar 30 13:53:40 p01-test-devops-9-81 ods-signerd: [socket] unable to handle outgoing tcp response: write() failed (Broken pipe)</div><div>><span class="Apple-tab-span" style="white-space:pre">          </span>Mar 30 13:54:41 p01-test-devops-9-81 ods-signerd: [socket] unable to handle outgoing tcp response: write() failed (Broken pipe)</div><div>><span class="Apple-tab-span" style="white-space:pre">          </span>Mar 30 13:54:54 p01-test-devops-9-81 ods-signerd: [xfrd] zone testzone9 cannot tcp write to 192.168.1.110: Broken pipe</div><div>><span class="Apple-tab-span" style="white-space:pre">           </span>Mar 30 13:54:54 p01-test-devops-9-81 ods-signerd: [xfrd] zone testzone8 cannot tcp write to 192.168.1.110: Broken pipe</div><div>><span class="Apple-tab-span" style="white-space:pre">           </span>Mar 30 13:54:54 p01-test-devops-9-81 ods-signerd: [xfrd] zone testzone6 cannot tcp write to 192.168.1.110: Broken pipe</div><div>><span class="Apple-tab-span" style="white-space:pre">           </span>Mar 30 13:54:54 p01-test-devops-9-81 ods-signerd: [xfrd] zone testzone2 cannot tcp write to 192.168.1.110: Broken pipe</div><div>><span class="Apple-tab-span" style="white-space:pre">           </span>... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... </div><div>><span class="Apple-tab-span" style="white-space:pre">            </span>Mar 30 19:03:14 p01-test-devops-9-81 ods-signerd: [xfrd] zone testzone7 cannot tcp write to 192.168.1.110: Broken pipe</div><div>><span class="Apple-tab-span" style="white-space:pre">           </span>Mar 30 19:03:14 p01-test-devops-9-81 ods-signerd: [xfrd] zone testzone6 cannot tcp write to 192.168.1.110: Broken pipe</div><div>><span class="Apple-tab-span" style="white-space:pre">           </span>Mar 30 19:25:55 p01-test-devops-9-81 ods-signerd: [STATS] testzone20 2015126051 RR[count=44 time=0(sec)] NSEC3[count=6 time=0(sec)] RRSIG[new=10 reused=172846 time=2(sec) avg=5(sig/sec)] TOTAL[time=8(sec)]</div><div>><span class="Apple-tab-span" style="white-space:pre">            </span>Mar 30 19:25:55 p01-test-devops-9-81 ods-signerd: [worker[4]] read zone testzone8</div><div>><span class="Apple-tab-span" style="white-space:pre">                </span>Mar 30 19:25:55 p01-test-devops-9-81 ods-signerd: [xfrd] zone testzone8 transfer done [notify acquired 1459337138, serial on disk 2015112767, notify serial 2015112767]</div><div>><span class="Apple-tab-span" style="white-space:pre">          </span>Mar 30 19:25:55 p01-test-devops-9-81 ods-signerd: [xfrd] zone testzone8 reset notify acquired</div><div>><span class="Apple-tab-span" style="white-space:pre">            </span>Mar 30 19:25:55 p01-test-devops-9-81 ods-signerd: [xfrd] tcp read xfr: release connection</div><div>><span class="Apple-tab-span" style="white-space:pre">                </span>Mar 30 19:25:55 p01-test-devops-9-81 ods-signerd: wire/notify.c:477: notify_handle_zone: assertion notify->handler.fd == -1 failed</div><div>></div><div>>        From above messages we could get that the signerd thread just work 6.5 H .</div><div>>        Could anybody please help me to fix this issue together?</div><div>></div><div>>With kind regards.</div><div>>Dean</div><div>Hi all , </div><div>        Last week we do some changes with source <span style="line-height: 23.8px;">wire/notify.c:477 and have solved above problem , the change as below :</span></div><div>            Base source version : 1.4.8</div><div>            Before :</div><div>                if (notify->is_waiting) {</div><div>                    ods_log_debug("[%s] already waiting, skipping notify for zone %s",<span style="line-height: 1.7;"> notify_str, zone->name);</span></div><div>                    ods_log_assert(notify->handler.fd == -1);</div><div>                    return;</div><div>                }</div><div>            After :</div><div>                if (notify->is_waiting) {</div><div>                    ods_log_debug("[%s] already waiting, skipping notify for zone %s",<span style="line-height: 1.7;"> notify_str, zone->name);</span></div><div>                    if (notify->handler.fd > 0) {</div><div>                        close(notify->handler.fd);</div><div>                        notify->handler.fd = -1;</div><div>                    }</div><div>                    return;</div><div>                }</div><div><br></div><div>        I monitoring the handle count which under ods-signerd thread for a week and didn't find any abnormal phenomena . </div><div>        The total number of<span style="line-height: 23.8px;"> handle count</span><span style="line-height: 1.7;"> remain at around 1500.</span></div><div>        Hope get some suggestions about the change .</div><div><br></div><div>With kind regards.</div><div>Dean</div></div><br><br><span title="neteasefooter"><p> </p></span>