]> git.baikalelectronics.ru Git - kernel.git/commit
Merge branch 'bpf-nfp-jmp-memcpy-improvements'
authorDaniel Borkmann <daniel@iogearbox.net>
Fri, 1 Dec 2017 19:59:21 +0000 (20:59 +0100)
committerDaniel Borkmann <daniel@iogearbox.net>
Fri, 1 Dec 2017 19:59:21 +0000 (20:59 +0100)
commit38e47bca803eb059b5acad8579e789b51b8d2a63
treed48a1e26d758bdbc44cd17a374df24591bf47404
parentac669e277b291426b8699856d1273e0e828da1c1
parent9cda82ec58fa9599a8b3ef8a3e19b09f59e30b5f
Merge branch 'bpf-nfp-jmp-memcpy-improvements'

Jiong Wang says:

====================
Currently, compiler will lower memcpy function call in XDP/eBPF C program
into a sequence of eBPF load/store pairs for some scenarios.

Compiler is thinking this "inline" optimiation is beneficial as it could
avoid function call and also increase code locality.

However, Netronome NPU is not an tranditional load/store architecture that
doing a sequence of individual load/store actions are not efficient.

This patch set tries to identify the load/store sequences composed of
load/store pairs that comes from memcpy lowering, then accelerates them
through NPU's Command Push Pull (CPP) instruction.

This patch set registered an new optimization pass before doing the actual
JIT work, it traverse through eBPF IR, once found candidate sequence then
record the memory copy source, destination and length information in the
first load instruction starting the sequence and marks all remaining
instructions in the sequence into skipable status. Later, when JITing the
first load instructoin, optimal instructions will be generated using those
record information.

For this safety of this transformation:

  - jump into the middle of the sequence will cancel the optimization.

  - overlapped memory access will cancel the optimization.

  - the load destination register still contains the same value as before
    the transformation.
====================

Signed-off-by: Daniel Borkmann <daniel@iogearbox.net>