drm/i915: Use the async worker to avoid reclaim tainting the ggtt->mutex

author Chris Wilson <chris@chris-wilson.co.uk>

Thu, 30 Jan 2020 18:17:10 +0000 (18:17 +0000)

committer Chris Wilson <chris@chris-wilson.co.uk>

Thu, 30 Jan 2020 21:35:43 +0000 (21:35 +0000)
author Chris Wilson <chris@chris-wilson.co.uk>
Thu, 30 Jan 2020 18:17:10 +0000 (18:17 +0000)
committer Chris Wilson <chris@chris-wilson.co.uk>
Thu, 30 Jan 2020 21:35:43 +0000 (21:35 +0000)
diff --git a/drivers/gpu/drm/i915/gt/intel_engine_cs.c b/drivers/gpu/drm/i915/gt/intel_engine_cs.c

index decb634624102c904984e87f3b879cbfd8e93554..86af5edd693366eef1c1cc1e11dee5ce2fe3171d 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_engine_cs.c
+++ b/drivers/gpu/drm/i915/gt/intel_engine_cs.c
@@ -527,7 +527,6 @@ static int pin_ggtt_status_page(struct intel_engine_cs *engine,
  {
         unsigned int flags;
  
-       flags = PIN_GLOBAL;
         if (!HAS_LLC(engine->i915) && i915_ggtt_has_aperture(engine->gt->ggtt))
                 /*
                  * On g33, we cannot place HWS above 256MiB, so
@@ -540,11 +539,11 @@ static int pin_ggtt_status_page(struct intel_engine_cs *engine,
                  * above the mappable region (even though we never
                  * actually map it).
                  */
-               flags |= PIN_MAPPABLE;
+               flags = PIN_MAPPABLE;
         else
-               flags |= PIN_HIGH;
+               flags = PIN_HIGH;
  
-       return i915_vma_pin(vma, 0, 0, flags);
+       return i915_ggtt_pin(vma, 0, flags);
  }
  
  static int init_status_page(struct intel_engine_cs *engine)
diff --git a/drivers/gpu/drm/i915/gt/intel_ggtt.c b/drivers/gpu/drm/i915/gt/intel_ggtt.c

index 91ec175c38ecc60123d9505ad51b1dd58b049efb..3b23b431bd5671d7854cd5a3927072a114919c17 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_ggtt.c
+++ b/drivers/gpu/drm/i915/gt/intel_ggtt.c
@@ -106,6 +106,11 @@ static bool needs_idle_maps(struct drm_i915_private *i915)
  
  void i915_ggtt_suspend(struct i915_ggtt *ggtt)
  {
+       struct i915_vma *vma;
+
+       list_for_each_entry(vma, &ggtt->vm.bound_list, vm_link)
+               i915_vma_wait_for_bind(vma);
+
         ggtt->vm.clear_range(&ggtt->vm, 0, ggtt->vm.total);
         ggtt->invalidate(ggtt);
  
@@ -841,6 +846,7 @@ static int gen8_gmch_probe(struct i915_ggtt *ggtt)
             IS_CHERRYVIEW(i915) /* fails with concurrent use/update */) {
                 ggtt->vm.insert_entries = bxt_vtd_ggtt_insert_entries__BKL;
                 ggtt->vm.insert_page    = bxt_vtd_ggtt_insert_page__BKL;
+               ggtt->vm.bind_async_flags = I915_VMA_GLOBAL_BIND;
         }
  
         ggtt->invalidate = gen8_ggtt_invalidate;
diff --git a/drivers/gpu/drm/i915/gt/intel_gt.c b/drivers/gpu/drm/i915/gt/intel_gt.c

index 51019611bc1e643b8cb767cd396bb6675329fa39..f1f1b306e0af0f2962d0f5f489b3b7304182ec58 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_gt.c
+++ b/drivers/gpu/drm/i915/gt/intel_gt.c
@@ -344,7 +344,7 @@ static int intel_gt_init_scratch(struct intel_gt *gt, unsigned int size)
                 goto err_unref;
         }
  
-       ret = i915_vma_pin(vma, 0, 0, PIN_GLOBAL | PIN_HIGH);
+       ret = i915_ggtt_pin(vma, 0, PIN_HIGH);
         if (ret)
                 goto err_unref;
  
diff --git a/drivers/gpu/drm/i915/gt/intel_lrc.c b/drivers/gpu/drm/i915/gt/intel_lrc.c

index 008e02bb642e77499b73491d660432b1751f6301..28cbe5f3a7d740893c6b75e7d6dae5837f4dd757 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_lrc.c
+++ b/drivers/gpu/drm/i915/gt/intel_lrc.c
@@ -3255,7 +3255,7 @@ static int lrc_setup_wa_ctx(struct intel_engine_cs *engine)
                 goto err;
         }
  
-       err = i915_vma_pin(vma, 0, 0, PIN_GLOBAL | PIN_HIGH);
+       err = i915_ggtt_pin(vma, 0, PIN_HIGH);
         if (err)
                 goto err;
  
diff --git a/drivers/gpu/drm/i915/gt/intel_ring.c b/drivers/gpu/drm/i915/gt/intel_ring.c

index 374b28f13ca0b4565adc32cd621ce0d69ad81d2c..366013367526919c9b7d0bc4863bc9a61f4410bd 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_ring.c
+++ b/drivers/gpu/drm/i915/gt/intel_ring.c
@@ -31,17 +31,15 @@ int intel_ring_pin(struct intel_ring *ring)
         if (atomic_fetch_inc(&ring->pin_count))
                 return 0;
  
-       flags = PIN_GLOBAL;
-
         /* Ring wraparound at offset 0 sometimes hangs. No idea why. */
-       flags |= PIN_OFFSET_BIAS | i915_ggtt_pin_bias(vma);
+       flags = PIN_OFFSET_BIAS | i915_ggtt_pin_bias(vma);
  
         if (vma->obj->stolen)
                 flags |= PIN_MAPPABLE;
         else
                 flags |= PIN_HIGH;
  
-       ret = i915_vma_pin(vma, 0, 0, flags);
+       ret = i915_ggtt_pin(vma, 0, flags);
         if (unlikely(ret))
                 goto err_unpin;
  
diff --git a/drivers/gpu/drm/i915/gt/intel_timeline.c b/drivers/gpu/drm/i915/gt/intel_timeline.c

index 87716529cd2fe36999c0d933cac54ad3b0de8b73..465f87b659011ad36186d58092f774bcbdca51cd 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_timeline.c
+++ b/drivers/gpu/drm/i915/gt/intel_timeline.c
@@ -308,7 +308,7 @@ int intel_timeline_pin(struct intel_timeline *tl)
         if (atomic_add_unless(&tl->pin_count, 1, 0))
                 return 0;
  
-       err = i915_vma_pin(tl->hwsp_ggtt, 0, 0, PIN_GLOBAL | PIN_HIGH);
+       err = i915_ggtt_pin(tl->hwsp_ggtt, 0, PIN_HIGH);
         if (err)
                 return err;
  
@@ -431,7 +431,7 @@ __intel_timeline_get_seqno(struct intel_timeline *tl,
                 goto err_rollback;
         }
  
-       err = i915_vma_pin(vma, 0, 0, PIN_GLOBAL | PIN_HIGH);
+       err = i915_ggtt_pin(vma, 0, PIN_HIGH);
         if (err) {
                 __idle_hwsp_free(vma->private, cacheline);
                 goto err_rollback;
diff --git a/drivers/gpu/drm/i915/gt/uc/intel_guc.c b/drivers/gpu/drm/i915/gt/uc/intel_guc.c

index 5d00a3b2d91436dd86a6f0a7ef916474b49fecf9..c4c1523da7a641529be11f4000022a3b6b414fdb 100644 (file)
--- a/drivers/gpu/drm/i915/gt/uc/intel_guc.c
+++ b/drivers/gpu/drm/i915/gt/uc/intel_guc.c
@@ -678,8 +678,8 @@ struct i915_vma *intel_guc_allocate_vma(struct intel_guc *guc, u32 size)
         if (IS_ERR(vma))
                 goto err;
  
-       flags = PIN_GLOBAL | PIN_OFFSET_BIAS | i915_ggtt_pin_bias(vma);
-       ret = i915_vma_pin(vma, 0, 0, flags);
+       flags = PIN_OFFSET_BIAS | i915_ggtt_pin_bias(vma);
+       ret = i915_ggtt_pin(vma, 0, flags);
         if (ret) {
                 vma = ERR_PTR(ret);
                 goto err;
diff --git a/drivers/gpu/drm/i915/i915_active.c b/drivers/gpu/drm/i915/i915_active.c

index 3d2e7cf55e52479f4d1cbc83fe97d94f05ad7653..da58e5d084f4c0fd343c88604e095fe6793bdac0 100644 (file)
--- a/drivers/gpu/drm/i915/i915_active.c
+++ b/drivers/gpu/drm/i915/i915_active.c
@@ -390,13 +390,19 @@ out:
         return err;
  }
  
-void i915_active_set_exclusive(struct i915_active *ref, struct dma_fence *f)
+struct dma_fence *
+i915_active_set_exclusive(struct i915_active *ref, struct dma_fence *f)
  {
+       struct dma_fence *prev;
+
         /* We expect the caller to manage the exclusive timeline ordering */
         GEM_BUG_ON(i915_active_is_idle(ref));
  
-       if (!__i915_active_fence_set(&ref->excl, f))
+       prev = __i915_active_fence_set(&ref->excl, f);
+       if (!prev)
                 atomic_inc(&ref->count);
+
+       return prev;
  }
  
  bool i915_active_acquire_if_busy(struct i915_active *ref)
diff --git a/drivers/gpu/drm/i915/i915_active.h b/drivers/gpu/drm/i915/i915_active.h

index 51e1e854ca5575157d0b84fc6e9077642712a9e1..973ff0447c6c306df235ec44784a3854feea8cf9 100644 (file)
--- a/drivers/gpu/drm/i915/i915_active.h
+++ b/drivers/gpu/drm/i915/i915_active.h
@@ -173,7 +173,8 @@ i915_active_add_request(struct i915_active *ref, struct i915_request *rq)
         return i915_active_ref(ref, i915_request_timeline(rq), &rq->fence);
  }
  
-void i915_active_set_exclusive(struct i915_active *ref, struct dma_fence *f);
+struct dma_fence *
+i915_active_set_exclusive(struct i915_active *ref, struct dma_fence *f);
  
  static inline bool i915_active_has_exclusive(struct i915_active *ref)
  {
diff --git a/drivers/gpu/drm/i915/i915_gem.c b/drivers/gpu/drm/i915/i915_gem.c

index 25fce35a46f9754c20f069ecb59d7e6d0b520911..7245e056ce776aec71df2123af6d1044b4c0e630 100644 (file)
--- a/drivers/gpu/drm/i915/i915_gem.c
+++ b/drivers/gpu/drm/i915/i915_gem.c
@@ -1009,6 +1009,12 @@ i915_gem_object_ggtt_pin(struct drm_i915_gem_object *obj,
         if (ret)
                 return ERR_PTR(ret);
  
+       ret = i915_vma_wait_for_bind(vma);
+       if (ret) {
+               i915_vma_unpin(vma);
+               return ERR_PTR(ret);
+       }
+
         return vma;
  }
  
diff --git a/drivers/gpu/drm/i915/i915_vma.c b/drivers/gpu/drm/i915/i915_vma.c

index 84e03da0d5f9703a9a156cef8f7a531f6820931c..e801e28de4705c3222907faa626fec8065179546 100644 (file)
--- a/drivers/gpu/drm/i915/i915_vma.c
+++ b/drivers/gpu/drm/i915/i915_vma.c
@@ -294,6 +294,7 @@ struct i915_vma_work {
         struct dma_fence_work base;
         struct i915_vma *vma;
         struct drm_i915_gem_object *pinned;
+       struct i915_sw_dma_fence_cb cb;
         enum i915_cache_level cache_level;
         unsigned int flags;
  };
@@ -339,6 +340,25 @@ struct i915_vma_work *i915_vma_work(void)
         return vw;
  }
  
+int i915_vma_wait_for_bind(struct i915_vma *vma)
+{
+       int err = 0;
+
+       if (rcu_access_pointer(vma->active.excl.fence)) {
+               struct dma_fence *fence;
+
+               rcu_read_lock();
+               fence = dma_fence_get_rcu_safe(&vma->active.excl.fence);
+               rcu_read_unlock();
+               if (fence) {
+                       err = dma_fence_wait(fence, MAX_SCHEDULE_TIMEOUT);
+                       dma_fence_put(fence);
+               }
+       }
+
+       return err;
+}
+
  /**
   * i915_vma_bind - Sets up PTEs for an VMA in it's corresponding address space.
   * @vma: VMA to map
@@ -386,6 +406,8 @@ int i915_vma_bind(struct i915_vma *vma,
  
         trace_i915_vma_bind(vma, bind_flags);
         if (work && (bind_flags & ~vma_flags) & vma->vm->bind_async_flags) {
+               struct dma_fence *prev;
+
                 work->vma = vma;
                 work->cache_level = cache_level;
                 work->flags = bind_flags | I915_VMA_ALLOC;
@@ -399,8 +421,12 @@ int i915_vma_bind(struct i915_vma *vma,
                  * part of the obj->resv->excl_fence as it only affects
                  * execution and not content or object's backing store lifetime.
                  */
-               GEM_BUG_ON(i915_active_has_exclusive(&vma->active));
-               i915_active_set_exclusive(&vma->active, &work->base.dma);
+               prev = i915_active_set_exclusive(&vma->active, &work->base.dma);
+               if (prev)
+                       __i915_sw_fence_await_dma_fence(&work->base.chain,
+                                                       prev,
+                                                       &work->cb);
+
                 work->base.dma.error = 0; /* enable the queue_work() */
  
                 if (vma->obj) {
@@ -408,7 +434,6 @@ int i915_vma_bind(struct i915_vma *vma,
                         work->pinned = vma->obj;
                 }
         } else {
-               GEM_BUG_ON((bind_flags & ~vma_flags) & vma->vm->bind_async_flags);
                 ret = vma->ops->bind_vma(vma, cache_level, bind_flags);
                 if (ret)
                         return ret;
@@ -977,8 +1002,14 @@ int i915_ggtt_pin(struct i915_vma *vma, u32 align, unsigned int flags)
  
         do {
                 err = i915_vma_pin(vma, 0, align, flags | PIN_GLOBAL);
-               if (err != -ENOSPC)
+               if (err != -ENOSPC) {
+                       if (!err) {
+                               err = i915_vma_wait_for_bind(vma);
+                               if (err)
+                                       i915_vma_unpin(vma);
+                       }
                         return err;
+               }
  
                 /* Unlike i915_vma_pin, we don't take no for an answer! */
                 flush_idle_contexts(vm->gt);
diff --git a/drivers/gpu/drm/i915/i915_vma.h b/drivers/gpu/drm/i915/i915_vma.h

index 02b31a62951eec75763173a2de5e2e117fa45744..e1ced1df13e1c7bffb0a1980eaf09b684e01f48e 100644 (file)
--- a/drivers/gpu/drm/i915/i915_vma.h
+++ b/drivers/gpu/drm/i915/i915_vma.h
@@ -375,6 +375,8 @@ struct i915_vma *i915_vma_make_unshrinkable(struct i915_vma *vma);
  void i915_vma_make_shrinkable(struct i915_vma *vma);
  void i915_vma_make_purgeable(struct i915_vma *vma);
  
+int i915_vma_wait_for_bind(struct i915_vma *vma);
+
  static inline int i915_vma_sync(struct i915_vma *vma)
  {
         /* Wait for the asynchronous bindings and pending GPU reads */
author	Chris Wilson <chris@chris-wilson.co.uk>
	Thu, 30 Jan 2020 18:17:10 +0000 (18:17 +0000)
committer	Chris Wilson <chris@chris-wilson.co.uk>
	Thu, 30 Jan 2020 21:35:43 +0000 (21:35 +0000)
drivers/gpu/drm/i915/gt/intel_engine_cs.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_ggtt.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_gt.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_lrc.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_ring.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_timeline.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/uc/intel_guc.c		patch \| blob \| history
drivers/gpu/drm/i915/i915_active.c		patch \| blob \| history
drivers/gpu/drm/i915/i915_active.h		patch \| blob \| history
drivers/gpu/drm/i915/i915_gem.c		patch \| blob \| history
drivers/gpu/drm/i915/i915_vma.c		patch \| blob \| history
drivers/gpu/drm/i915/i915_vma.h		patch \| blob \| history