c++ socket编程实战系列（2）：Windows服务器端判断客户端socket断开连接几种方法-iaspnetcore.com

一、客户端断开的场景描述

以下是针对socket使用TCP协议的情况

1.客户端主动断开连接：如果是使用的是TCP协议,客户端close,服务端recv会收到到0字节。

2.客户端非正常断开：如网络的掉线情况、拔掉网线，需要做心跳。需要自己定义一个定时器来扫描客户端是否还保持连接。

二、客户端断开通信原理

一般如果如果服务器段的线程或者进程阻塞在read（IO复用也会返回EOF）的话，发起释放连接的一端会发送一个FIN包，这时候read不会被阻塞，会返回EOF，此时服务端应该做error处理。

以下针对堵塞socket的recv函数会在以下三种情况下返回：
（1）recv到数据时，会返回数据字节长度。
（2）在整个程序接收到信号时，返回-1。errno = EINTR。//在程序的起始阶段，屏蔽掉信号的除外。部分信号还是屏蔽不掉的。
（3）socket出现问题时，返回-1.具体错误码看 man recv()
（4）一定要看 man 说明，很详细，很有帮助。
这种方法经过长时间测试后，是有效的。所以写出来让大家参考一下，请大家发表意见。

以下针对堵塞socket的send函数的情况下返回：

（1）套接字在你send的时候，如果对端有问题，是会返回错误的，返回值-1，errno被设置，一般errno有以下几种，它们都是ICMP差错报文提供的支持，给你粘几个：

ECONNRESET //著名的RST
A connection was forcibly closed by a peer.

EDESTADDRREQ
The socket is not connection-mode and does not have its peer address set, and no destination address was specified.

       EHOSTUNREACH
              The destination host cannot be reached (probably because the host is down or a remote router cannot reach it).
       ENETUNREACH
              No route to the network is present.

recv函数返回值说明

int recv( SOCKET s, char FAR *buf, int len, int flags);

不论是客户还是服务器应用程序都用recv函数从TCP连接的另一端接收数据。

该函数的第一个参数指定接收端套接字描述符；

第二个参数指明一个缓冲区，该缓冲区用来存放recv函数接收到的数据；

第三个参数指明buf的长度；第四个参数一般置0。

这里只描述同步Socket的recv函数的执行流程。当应用程序调用recv函数时，

（1）recv先等待s的发送缓冲中的数据被协议传送完毕，如果协议在传送s的发送缓冲中的数据时出现网络错误，那么recv函数返回SOCKET_ERROR，

（2）如果s的发送缓冲中没有数据或者数据被协议成功发送完毕后，recv先检查套接字s的接收缓冲区，

如果s接收缓冲区中没有数据或者协议正在接收数据，那么recv就一直等待，直到协议把数据接收完毕。

当协议把数据接收完毕，recv函数就把s的接收缓冲中的数据copy到buf中

（注意协议接收到的数据可能大于buf的长度，所以在这种情况下要调用几次recv函数才能把s的接收缓冲中的数据copy完。

recv函数仅仅是copy数据，真正的接收数据是协议来完成的）， recv函数返回其实际copy的字节数。

如果recv在copy时出错，那么它返回SOCKET_ERROR；

如果recv函数在等待协议接收数据时网络中断了，那么它返回0。

默认 socket 是阻塞的解阻塞与非阻塞recv返回值没有区分，都是 <0 出错 =0 连接关闭 >0 接收到数据大小，

特别：

返回值<0时并且(errno == EINTR || errno == EWOULDBLOCK || errno == EAGAIN)的情况下认为连接是正常的，继续接收。

只是阻塞模式下recv会阻塞着接收数据，非阻塞模式下如果没有数据会返回，不会阻塞着读，因此需要循环读取）。

返回说明：

成功执行时，返回接收到的字节数。

另一端已关闭则返回0。

失败返回-1，

errno被设为以下的某个值

EAGAIN：套接字已标记为非阻塞，而接收操作被阻塞或者接收超时

EBADF：sock不是有效的描述词

ECONNREFUSE：远程主机阻绝网络连接

EFAULT：内存空间访问出错

EINTR：操作被信号中断

EINVAL：参数无效

ENOMEM：内存不足

ENOTCONN：与面向连接关联的套接字尚未被连接上

ENOTSOCK：sock索引的不是套接字当返回值是0时，为正常关闭连接；

思考：

当对侧没有send，即本侧的套接字s的接收缓冲区无数据，返回值是什么（EAGAIN，原因为超时，待测）

三、服务器端判断客户端socket断开连接几种方法

1, 如果服务端的Socket比客户端的Socket先关闭，会导致客户端出现TIME_WAIT状态，占用系统资源。

所以，必须等客户端先关闭Socket后，服务器端再关闭Socket才能避免TIME_WAIT状态的出现。

2, 在linux下写socket的程序的时候，如果尝试send到一个disconnected socket上，就会让底层抛出一个SIGPIPE信号。

client端通过 pipe 发送信息到server端后，就关闭client端, 这时server端,返回信息给 client 端时就产生Broken pipe 信号了。

当服务器close一个连接时，若client端接着发数据。根据TCP协议的规定，会收到一个RST响应，client再往这个服务器发送数据时，系统会发出一个SIGPIPE信号给进程，告诉进程这个连接已经断开了，不要再写了。
根据信号的默认处理规则SIGPIPE信号的默认执行动作是terminate(终止、退出),所以client会退出。若不想客户端退出可以把SIGPIPE设为SIG_IGN

如: signal(SIGPIPE,SIG_IGN);
这时SIGPIPE交给了系统处理。

    这个信号的缺省处理方法是退出进程，大多数时候这都不是我们期望的。因此我们需要重载这个信号的处理方法。调用以下代码，即可安全的屏蔽SIGPIPE：
    struct sigaction sa;
    sa.sa_handler = SIG_IGN;
    sigaction( SIGPIPE, &sa, 0 );

服务器采用了fork的话，要收集垃圾进程，防止僵尸进程的产生，可以这样处理：
signal(SIGCHLD,SIG_IGN);　交给系统init去回收。
这里子进程就不会产生僵尸进程了。

判断连接断开的方法

法一：

当recv()返回值小于等于0时，socket连接断开。但是还需要判断 errno是否等于 EINTR，如果errno == EINTR 则说明recv函数是由于程序接收到信号后返回的，socket连接还是正常的，不应close掉socket连接。

法二：

struct tcp_info info;
int len=sizeof(info);
getsockopt(sock, IPPROTO_TCP, TCP_INFO, &info, (socklen_t *)&len);
if((info.tcpi_state==TCP_ESTABLISHED)) 则说明未断开 else 断开

法三：

若使用了select等系统函数，若远端断开，则select返回1，recv返回0则断开。其他注意事项同法一。

法四：

int keepAlive = 1; // 开启keepalive属性
int keepIdle = 60; // 如该连接在60秒内没有任何数据往来,则进行探测
int keepInterval = 5; // 探测时发包的时间间隔为5 秒
int keepCount = 3; // 探测尝试的次数.如果第1次探测包就收到响应了,则后2次的不再发.

setsockopt(rs, SOL_SOCKET, SO_KEEPALIVE, (void *)&keepAlive, sizeof(keepAlive));
setsockopt(rs, SOL_TCP, TCP_KEEPIDLE, (void*)&keepIdle, sizeof(keepIdle));
setsockopt(rs, SOL_TCP, TCP_KEEPINTVL, (void *)&keepInterval, sizeof(keepInterval));
setsockopt(rs, SOL_TCP, TCP_KEEPCNT, (void *)&keepCount, sizeof(keepCount));

设置后，若断开，则在使用该socket读写时立即失败，并返回ETIMEDOUT错误

法五：

自己实现一个心跳检测，一定时间内未收到自定义的心跳包则标记为已断开。

另外一网摘，方法如下：

判断客户端Socket的关闭

最近试验发现，当客户端Socket关闭时，服务端的Socket会接收到0字节的通知。

private int Receive(StringBuilder sb)

{

int read = 0, total = 0;

if (_Client != null)

{

try

{

byte[] bytes = new byte[SIZE];

int available = _Client.Available;

{

read = _Client.Receive(bytes);//如果客户端Socket关闭，_Client会接受到read=0

total += read;

if (read > 0)

sb.Append(_Server.DefaultEncoding.GetString(bytes, 0, read));

} while (read > 0 && total < available);

}

catch (SocketException)

{

CloseSocket();

}

if (_Server.TraceInConsole && total > 0)

{

Console.WriteLine("Receive:" + total + "======================================");

Console.WriteLine(sb.ToString());

}

return total;

}

利用0字节接收条件判断客户端Socket的关闭，开始执行服务端Socket关闭代码。

private void ThreadHandler()

{

if (_Server.TraceInConsole)

Console.WriteLine("Begin HttpRequest...");

try

{

while (true)

{

StringBuilder sb = new StringBuilder();

int receive = Receive(sb);

if (receive > 0)

{

_Server.ReadRequest(this, sb.ToString());

_Server.Response(this);

_Server.ResponseFinished(this);

}

else

{

TryCloseSocket();

}

if (_Client == null)

break;

}

catch (Exception ex)

{

if (_Server.TraceInConsole)

Console.WriteLine(ex.Message);

}

if (_Server.TraceInConsole)

Console.WriteLine("End HttpRequest.");

}

服务端Socket的关闭

如果直接调用Socket的Close方法会关闭得太快，可能导致客户端TIME_WAIT现象；而Thead.Sleep延时再调用Socket的Close方法也不理想。应该采用尝试向客户端发送数据，然后利用异常来关闭Socket，方法如下。

private void TryCloseSocket()

{

try

{

while (true)

{

Thread.Sleep(1500);

Send(HttpServer.BYTES_CRLF); //发送自定义的字节，如果客户端关闭出现SocketException，然后关闭服务端Socket

if (_Client == null)

break;

}

catch (SocketException)

{

CloseSocket();

}

private void CloseSocket()

{

if (_Client != null)

{

_Client.Shutdown(SocketShutdown.Both);

_Client.Close();

_Client = null;

if (_Server.TraceInConsole)

{

Console.WriteLine("Close socket.");

}

方法六：

socket类，有一个方法sendUrgentData，查看文档后得知它会往输出流发送一个字节的数据，只要对方Socket的SO_OOBINLINE属性没有打开，就会自动舍弃这个字节，而SO_OOBINLINE属性默认情况下就是关闭的，太好了，正是我需要的！

于是，下面一段代码就可以判断远端是否断开了连接：

try{
socket.sendUrgentData(0xFF);
}catch(Exception ex){
reconnect();