mptcp: wake-up readers only for in sequence data

author Paolo Abeni <pabeni@redhat.com>

Thu, 10 Jun 2021 22:59:41 +0000 (15:59 -0700)

committer David S. Miller <davem@davemloft.net>

Thu, 10 Jun 2021 23:47:44 +0000 (16:47 -0700)
author Paolo Abeni <pabeni@redhat.com>
Thu, 10 Jun 2021 22:59:41 +0000 (15:59 -0700)
committer David S. Miller <davem@davemloft.net>
Thu, 10 Jun 2021 23:47:44 +0000 (16:47 -0700)
diff --git a/net/mptcp/protocol.c b/net/mptcp/protocol.c

index 534cf500521df8ee5ca3509cbcbf9a2ae17339f0..f6e62a6dc9fbd18e7fbc20a8e954ce5511140cae 100644 (file)
--- a/net/mptcp/protocol.c
+++ b/net/mptcp/protocol.c
@@ -670,15 +670,13 @@ static bool __mptcp_ofo_queue(struct mptcp_sock *msk)
  /* In most cases we will be able to lock the mptcp socket.  If its already
   * owned, we need to defer to the work queue to avoid ABBA deadlock.
   */
-static void move_skbs_to_msk(struct mptcp_sock *msk, struct sock *ssk)
+static bool move_skbs_to_msk(struct mptcp_sock *msk, struct sock *ssk)
  {
         struct sock *sk = (struct sock *)msk;
         unsigned int moved = 0;
  
         if (inet_sk_state_load(sk) == TCP_CLOSE)
-               return;
-
-       mptcp_data_lock(sk);
+               return false;
  
         __mptcp_move_skbs_from_subflow(msk, ssk, &moved);
         __mptcp_ofo_queue(msk);
@@ -690,7 +688,7 @@ static void move_skbs_to_msk(struct mptcp_sock *msk, struct sock *ssk)
          */
         if (mptcp_pending_data_fin(sk, NULL))
                 mptcp_schedule_work(sk);
-       mptcp_data_unlock(sk);
+       return moved > 0;
  }
  
  void mptcp_data_ready(struct sock *sk, struct sock *ssk)
@@ -698,7 +696,6 @@ void mptcp_data_ready(struct sock *sk, struct sock *ssk)
         struct mptcp_subflow_context *subflow = mptcp_subflow_ctx(ssk);
         struct mptcp_sock *msk = mptcp_sk(sk);
         int sk_rbuf, ssk_rbuf;
-       bool wake;
  
         /* The peer can send data while we are shutting down this
          * subflow at msk destruction time, but we must avoid enqueuing
@@ -707,28 +704,22 @@ void mptcp_data_ready(struct sock *sk, struct sock *ssk)
         if (unlikely(subflow->disposable))
                 return;
  
-       /* move_skbs_to_msk below can legitly clear the data_avail flag,
-        * but we will need later to properly woke the reader, cache its
-        * value
-        */
-       wake = subflow->data_avail == MPTCP_SUBFLOW_DATA_AVAIL;
-       if (wake)
-               set_bit(MPTCP_DATA_READY, &msk->flags);
-
         ssk_rbuf = READ_ONCE(ssk->sk_rcvbuf);
         sk_rbuf = READ_ONCE(sk->sk_rcvbuf);
         if (unlikely(ssk_rbuf > sk_rbuf))
                 sk_rbuf = ssk_rbuf;
  
-       /* over limit? can't append more skbs to msk */
+       /* over limit? can't append more skbs to msk, Also, no need to wake-up*/
         if (atomic_read(&sk->sk_rmem_alloc) > sk_rbuf)
-               goto wake;
-
-       move_skbs_to_msk(msk, ssk);
+               return;
  
-wake:
-       if (wake)
+       /* Wake-up the reader only for in-sequence data */
+       mptcp_data_lock(sk);
+       if (move_skbs_to_msk(msk, ssk)) {
+               set_bit(MPTCP_DATA_READY, &msk->flags);
                 sk->sk_data_ready(sk);
+       }
+       mptcp_data_unlock(sk);
  }
  
  static bool mptcp_do_flush_join_list(struct mptcp_sock *msk)
@@ -860,7 +851,7 @@ static struct sock *mptcp_subflow_recv_lookup(const struct mptcp_sock *msk)
         sock_owned_by_me(sk);
  
         mptcp_for_each_subflow(msk, subflow) {
-               if (subflow->data_avail)
+               if (READ_ONCE(subflow->data_avail))
                         return mptcp_subflow_tcp_sock(subflow);
         }
  
diff --git a/net/mptcp/protocol.h b/net/mptcp/protocol.h

index 0c6f99c6734575446d29ddbd839eebf9deefade2..385796f0ef19b3829ee23b464a8b1e1941c65787 100644 (file)
--- a/net/mptcp/protocol.h
+++ b/net/mptcp/protocol.h
@@ -362,7 +362,6 @@ mptcp_subflow_rsk(const struct request_sock *rsk)
  enum mptcp_data_avail {
         MPTCP_SUBFLOW_NODATA,
         MPTCP_SUBFLOW_DATA_AVAIL,
-       MPTCP_SUBFLOW_OOO_DATA
  };
  
  struct mptcp_delegated_action {
diff --git a/net/mptcp/subflow.c b/net/mptcp/subflow.c

index ef3d037f984a90abb450f47c1c6e334a1824592b..ebb898acd65ab12ea4953fff52c3440cdd1de6ae 100644 (file)
--- a/net/mptcp/subflow.c
+++ b/net/mptcp/subflow.c
@@ -1000,7 +1000,7 @@ static bool subflow_check_data_avail(struct sock *ssk)
         struct sk_buff *skb;
  
         if (!skb_peek(&ssk->sk_receive_queue))
-               subflow->data_avail = 0;
+               WRITE_ONCE(subflow->data_avail, 0);
         if (subflow->data_avail)
                 return true;
  
@@ -1039,18 +1039,13 @@ static bool subflow_check_data_avail(struct sock *ssk)
                 ack_seq = mptcp_subflow_get_mapped_dsn(subflow);
                 pr_debug("msk ack_seq=%llx subflow ack_seq=%llx", old_ack,
                          ack_seq);
-               if (ack_seq == old_ack) {
-                       subflow->data_avail = MPTCP_SUBFLOW_DATA_AVAIL;
-                       break;
-               } else if (after64(ack_seq, old_ack)) {
-                       subflow->data_avail = MPTCP_SUBFLOW_OOO_DATA;
-                       break;
+               if (unlikely(before64(ack_seq, old_ack))) {
+                       mptcp_subflow_discard_data(ssk, skb, old_ack - ack_seq);
+                       continue;
                 }
  
-               /* only accept in-sequence mapping. Old values are spurious
-                * retransmission
-                */
-               mptcp_subflow_discard_data(ssk, skb, old_ack - ack_seq);
+               WRITE_ONCE(subflow->data_avail, MPTCP_SUBFLOW_DATA_AVAIL);
+               break;
         }
         return true;
  
@@ -1070,7 +1065,7 @@ fallback:
                 subflow->reset_transient = 0;
                 subflow->reset_reason = MPTCP_RST_EMPTCP;
                 tcp_send_active_reset(ssk, GFP_ATOMIC);
-               subflow->data_avail = 0;
+               WRITE_ONCE(subflow->data_avail, 0);
                 return false;
         }
  
@@ -1080,7 +1075,7 @@ fallback:
         subflow->map_seq = READ_ONCE(msk->ack_seq);
         subflow->map_data_len = skb->len;
         subflow->map_subflow_seq = tcp_sk(ssk)->copied_seq - subflow->ssn_offset;
-       subflow->data_avail = MPTCP_SUBFLOW_DATA_AVAIL;
+       WRITE_ONCE(subflow->data_avail, MPTCP_SUBFLOW_DATA_AVAIL);
         return true;
  }
  
@@ -1092,7 +1087,7 @@ bool mptcp_subflow_data_available(struct sock *sk)
         if (subflow->map_valid &&
             mptcp_subflow_get_map_offset(subflow) >= subflow->map_data_len) {
                 subflow->map_valid = 0;
-               subflow->data_avail = 0;
+               WRITE_ONCE(subflow->data_avail, 0);
  
                 pr_debug("Done with mapping: seq=%u data_len=%u",
                          subflow->map_subflow_seq,
author	Paolo Abeni <pabeni@redhat.com>
	Thu, 10 Jun 2021 22:59:41 +0000 (15:59 -0700)
committer	David S. Miller <davem@davemloft.net>
	Thu, 10 Jun 2021 23:47:44 +0000 (16:47 -0700)
net/mptcp/protocol.c		patch \| blob \| history
net/mptcp/protocol.h		patch \| blob \| history
net/mptcp/subflow.c		patch \| blob \| history