]> git.baikalelectronics.ru Git - kernel.git/commit
tcp-tso: do not split TSO packets at retransmit time
authorEric Dumazet <edumazet@google.com>
Thu, 21 Apr 2016 17:55:23 +0000 (10:55 -0700)
committerDavid S. Miller <davem@davemloft.net>
Sun, 24 Apr 2016 18:43:59 +0000 (14:43 -0400)
commitc24f111438b42a44f370ddebd61bfd86a4d6aec6
treeac01b70cff99ad2e59c54e80ddcd524eaa9691a8
parent25c926be32f52ef020484f0a982b6d851e968ffe
tcp-tso: do not split TSO packets at retransmit time

Linux TCP stack painfully segments all TSO/GSO packets before retransmits.

This was fine back in the days when TSO/GSO were emerging, with their
bugs, but we believe the dark age is over.

Keeping big packets in write queues, but also in stack traversal
has a lot of benefits.
 - Less memory overhead, because write queues have less skbs
 - Less cpu overhead at ACK processing.
 - Better SACK processing, as lot of studies mentioned how
   awful linux was at this ;)
 - Less cpu overhead to send the rtx packets
   (IP stack traversal, netfilter traversal, drivers...)
 - Better latencies in presence of losses.
 - Smaller spikes in fq like packet schedulers, as retransmits
   are not constrained by TCP Small Queues.

1 % packet losses are common today, and at 100Gbit speeds, this
translates to ~80,000 losses per second.
Losses are often correlated, and we see many retransmit events
leading to 1-MSS train of packets, at the time hosts are already
under stress.

Signed-off-by: Eric Dumazet <edumazet@google.com>
Acked-by: Yuchung Cheng <ycheng@google.com>
Signed-off-by: David S. Miller <davem@davemloft.net>
include/net/tcp.h
net/ipv4/tcp_input.c
net/ipv4/tcp_output.c
net/ipv4/tcp_timer.c