btrfs: zoned: properly finish block group on metadata write

author Naohiro Aota <naohiro.aota@wdc.com>

Wed, 4 May 2022 00:48:53 +0000 (17:48 -0700)

committer David Sterba <dsterba@suse.com>

Mon, 16 May 2022 15:17:32 +0000 (17:17 +0200)
author Naohiro Aota <naohiro.aota@wdc.com>
Wed, 4 May 2022 00:48:53 +0000 (17:48 -0700)
committer David Sterba <dsterba@suse.com>
Mon, 16 May 2022 15:17:32 +0000 (17:17 +0200)
diff --git a/fs/btrfs/block-group.h b/fs/btrfs/block-group.h

index c9bf01dd10e8bb516ac9a6d1897afbd7aec5cca5..3ac668ace50aac9624d3f4316944bdb4e300d6e6 100644 (file)
--- a/fs/btrfs/block-group.h
+++ b/fs/btrfs/block-group.h
@@ -212,6 +212,8 @@ struct btrfs_block_group {
         u64 meta_write_pointer;
         struct map_lookup *physical_map;
         struct list_head active_bg_list;
+       struct work_struct zone_finish_work;
+       struct extent_buffer *last_eb;
  };
  
  static inline u64 btrfs_block_group_end(struct btrfs_block_group *block_group)
diff --git a/fs/btrfs/extent_io.c b/fs/btrfs/extent_io.c

index 1b1baeb0d76bc6bc3927a17483197db8c0f1c0b0..588c7c606a2c6a360539eb074244355f9f06d63a 100644 (file)
--- a/fs/btrfs/extent_io.c
+++ b/fs/btrfs/extent_io.c
@@ -4251,9 +4251,6 @@ void wait_on_extent_buffer_writeback(struct extent_buffer *eb)
  
  static void end_extent_buffer_writeback(struct extent_buffer *eb)
  {
-       if (test_bit(EXTENT_BUFFER_ZONE_FINISH, &eb->bflags))
-               btrfs_zone_finish_endio(eb->fs_info, eb->start, eb->len);
-
         clear_bit(EXTENT_BUFFER_WRITEBACK, &eb->bflags);
         smp_mb__after_atomic();
         wake_up_bit(&eb->bflags, EXTENT_BUFFER_WRITEBACK);
@@ -4843,8 +4840,7 @@ static int submit_eb_page(struct page *page, struct writeback_control *wbc,
                 /*
                  * Implies write in zoned mode. Mark the last eb in a block group.
                  */
-               if (cache->seq_zone && eb->start + eb->len == cache->zone_capacity)
-                       set_bit(EXTENT_BUFFER_ZONE_FINISH, &eb->bflags);
+               btrfs_schedule_zone_finish_bg(cache, eb);
                 btrfs_put_block_group(cache);
         }
         ret = write_one_eb(eb, wbc, epd);
diff --git a/fs/btrfs/extent_io.h b/fs/btrfs/extent_io.h

index 17674b7e699c66b9733f10f0e93dd44a32424c56..956fa434df435859d02d5404afb5c1c3d5b8c9c7 100644 (file)
--- a/fs/btrfs/extent_io.h
+++ b/fs/btrfs/extent_io.h
@@ -26,7 +26,6 @@ enum {
         /* write IO error */
         EXTENT_BUFFER_WRITE_ERR,
         EXTENT_BUFFER_NO_CHECK,
-       EXTENT_BUFFER_ZONE_FINISH,
  };
  
  /* these are flags for __process_pages_contig */
diff --git a/fs/btrfs/zoned.c b/fs/btrfs/zoned.c

index cce46d6bb2314d3317a33037d8ca48dba981c005..488577efd8267ee1d2bc38957b6c0f8e66c30ea4 100644 (file)
--- a/fs/btrfs/zoned.c
+++ b/fs/btrfs/zoned.c
@@ -2046,6 +2046,37 @@ out:
         btrfs_put_block_group(block_group);
  }
  
+static void btrfs_zone_finish_endio_workfn(struct work_struct *work)
+{
+       struct btrfs_block_group *bg =
+               container_of(work, struct btrfs_block_group, zone_finish_work);
+
+       wait_on_extent_buffer_writeback(bg->last_eb);
+       free_extent_buffer(bg->last_eb);
+       btrfs_zone_finish_endio(bg->fs_info, bg->start, bg->length);
+       btrfs_put_block_group(bg);
+}
+
+void btrfs_schedule_zone_finish_bg(struct btrfs_block_group *bg,
+                                  struct extent_buffer *eb)
+{
+       if (!bg->seq_zone || eb->start + eb->len * 2 <= bg->start + bg->zone_capacity)
+               return;
+
+       if (WARN_ON(bg->zone_finish_work.func == btrfs_zone_finish_endio_workfn)) {
+               btrfs_err(bg->fs_info, "double scheduling of bg %llu zone finishing",
+                         bg->start);
+               return;
+       }
+
+       /* For the work */
+       btrfs_get_block_group(bg);
+       atomic_inc(&eb->refs);
+       bg->last_eb = eb;
+       INIT_WORK(&bg->zone_finish_work, btrfs_zone_finish_endio_workfn);
+       queue_work(system_unbound_wq, &bg->zone_finish_work);
+}
+
  void btrfs_clear_data_reloc_bg(struct btrfs_block_group *bg)
  {
         struct btrfs_fs_info *fs_info = bg->fs_info;
diff --git a/fs/btrfs/zoned.h b/fs/btrfs/zoned.h

index 7178bafda469c97d24fe273860cd9e53bcecad23..bb1a189e11f9016aa713adba7a33ad05511c9e80 100644 (file)
--- a/fs/btrfs/zoned.h
+++ b/fs/btrfs/zoned.h
@@ -72,6 +72,8 @@ int btrfs_zone_finish(struct btrfs_block_group *block_group);
  bool btrfs_can_activate_zone(struct btrfs_fs_devices *fs_devices, u64 flags);
  void btrfs_zone_finish_endio(struct btrfs_fs_info *fs_info, u64 logical,
                              u64 length);
+void btrfs_schedule_zone_finish_bg(struct btrfs_block_group *bg,
+                                  struct extent_buffer *eb);
  void btrfs_clear_data_reloc_bg(struct btrfs_block_group *bg);
  void btrfs_free_zone_cache(struct btrfs_fs_info *fs_info);
  bool btrfs_zoned_should_reclaim(struct btrfs_fs_info *fs_info);
@@ -230,6 +232,9 @@ static inline bool btrfs_can_activate_zone(struct btrfs_fs_devices *fs_devices,
  static inline void btrfs_zone_finish_endio(struct btrfs_fs_info *fs_info,
                                            u64 logical, u64 length) { }
  
+static inline void btrfs_schedule_zone_finish_bg(struct btrfs_block_group *bg,
+                                                struct extent_buffer *eb) { }
+
  static inline void btrfs_clear_data_reloc_bg(struct btrfs_block_group *bg) { }
  
  static inline void btrfs_free_zone_cache(struct btrfs_fs_info *fs_info) { }
author	Naohiro Aota <naohiro.aota@wdc.com>
	Wed, 4 May 2022 00:48:53 +0000 (17:48 -0700)
committer	David Sterba <dsterba@suse.com>
	Mon, 16 May 2022 15:17:32 +0000 (17:17 +0200)
fs/btrfs/block-group.h		patch \| blob \| history
fs/btrfs/extent_io.c		patch \| blob \| history
fs/btrfs/extent_io.h		patch \| blob \| history
fs/btrfs/zoned.c		patch \| blob \| history
fs/btrfs/zoned.h		patch \| blob \| history