block: introduce zone_write_granularity limit

author Damien Le Moal <damien.lemoal@wdc.com>

Thu, 28 Jan 2021 04:47:30 +0000 (13:47 +0900)

committer Jens Axboe <axboe@kernel.dk>

Wed, 10 Feb 2021 14:44:40 +0000 (07:44 -0700)
author Damien Le Moal <damien.lemoal@wdc.com>
Thu, 28 Jan 2021 04:47:30 +0000 (13:47 +0900)
committer Jens Axboe <axboe@kernel.dk>
Wed, 10 Feb 2021 14:44:40 +0000 (07:44 -0700)
diff --git a/Documentation/block/queue-sysfs.rst b/Documentation/block/queue-sysfs.rst

index edc6e6960b96ee06c8f163dcfe1045939aa74471..4dc7f0d499a8454f08f6d2187ced4f6482353721 100644 (file)
--- a/Documentation/block/queue-sysfs.rst
+++ b/Documentation/block/queue-sysfs.rst
@@ -279,4 +279,11 @@ devices are described in the ZBC (Zoned Block Commands) and ZAC
  do not support zone commands, they will be treated as regular block devices
  and zoned will report "none".
  
+zone_write_granularity (RO)
+---------------------------
+This indicates the alignment constraint, in bytes, for write operations in
+sequential zones of zoned block devices (devices with a zoned attributed
+that reports "host-managed" or "host-aware"). This value is always 0 for
+regular block devices.
+
  Jens Axboe <jens.axboe@oracle.com>, February 2009
diff --git a/block/blk-settings.c b/block/blk-settings.c

index 4c974340f1a9923fdf24533d12a1427836ed567e..a1e66165adcf4b36838adc0f65de96244fea72be 100644 (file)
--- a/block/blk-settings.c
+++ b/block/blk-settings.c
@@ -60,6 +60,7 @@ void blk_set_default_limits(struct queue_limits *lim)
         lim->io_opt = 0;
         lim->misaligned = 0;
         lim->zoned = BLK_ZONED_NONE;
+       lim->zone_write_granularity = 0;
  }
  EXPORT_SYMBOL(blk_set_default_limits);
  
@@ -366,6 +367,28 @@ void blk_queue_physical_block_size(struct request_queue *q, unsigned int size)
  }
  EXPORT_SYMBOL(blk_queue_physical_block_size);
  
+/**
+ * blk_queue_zone_write_granularity - set zone write granularity for the queue
+ * @q:  the request queue for the zoned device
+ * @size:  the zone write granularity size, in bytes
+ *
+ * Description:
+ *   This should be set to the lowest possible size allowing to write in
+ *   sequential zones of a zoned block device.
+ */
+void blk_queue_zone_write_granularity(struct request_queue *q,
+                                     unsigned int size)
+{
+       if (WARN_ON_ONCE(!blk_queue_is_zoned(q)))
+               return;
+
+       q->limits.zone_write_granularity = size;
+
+       if (q->limits.zone_write_granularity < q->limits.logical_block_size)
+               q->limits.zone_write_granularity = q->limits.logical_block_size;
+}
+EXPORT_SYMBOL_GPL(blk_queue_zone_write_granularity);
+
  /**
   * blk_queue_alignment_offset - set physical block alignment offset
   * @q: the request queue for the device
@@ -631,6 +654,8 @@ int blk_stack_limits(struct queue_limits *t, struct queue_limits *b,
                         t->discard_granularity;
         }
  
+       t->zone_write_granularity = max(t->zone_write_granularity,
+                                       b->zone_write_granularity);
         t->zoned = max(t->zoned, b->zoned);
         return ret;
  }
@@ -847,6 +872,8 @@ EXPORT_SYMBOL_GPL(blk_queue_can_use_dma_map_merging);
   */
  void blk_queue_set_zoned(struct gendisk *disk, enum blk_zoned_model model)
  {
+       struct request_queue *q = disk->queue;
+
         switch (model) {
         case BLK_ZONED_HM:
                 /*
@@ -875,7 +902,15 @@ void blk_queue_set_zoned(struct gendisk *disk, enum blk_zoned_model model)
                 break;
         }
  
-       disk->queue->limits.zoned = model;
+       q->limits.zoned = model;
+       if (model != BLK_ZONED_NONE) {
+               /*
+                * Set the zone write granularity to the device logical block
+                * size by default. The driver can change this value if needed.
+                */
+               blk_queue_zone_write_granularity(q,
+                                               queue_logical_block_size(q));
+       }
  }
  EXPORT_SYMBOL_GPL(blk_queue_set_zoned);
  
diff --git a/block/blk-sysfs.c b/block/blk-sysfs.c

index b513f1683af06f8cb8d43361a13620cb14c6d20c..ae39c7f3d83dc02e437c7590caf2e948d7f599a0 100644 (file)
--- a/block/blk-sysfs.c
+++ b/block/blk-sysfs.c
@@ -219,6 +219,12 @@ static ssize_t queue_write_zeroes_max_show(struct request_queue *q, char *page)
                 (unsigned long long)q->limits.max_write_zeroes_sectors << 9);
  }
  
+static ssize_t queue_zone_write_granularity_show(struct request_queue *q,
+                                                char *page)
+{
+       return queue_var_show(queue_zone_write_granularity(q), page);
+}
+
  static ssize_t queue_zone_append_max_show(struct request_queue *q, char *page)
  {
         unsigned long long max_sectors = q->limits.max_zone_append_sectors;
@@ -585,6 +591,7 @@ QUEUE_RO_ENTRY(queue_discard_zeroes_data, "discard_zeroes_data");
  QUEUE_RO_ENTRY(queue_write_same_max, "write_same_max_bytes");
  QUEUE_RO_ENTRY(queue_write_zeroes_max, "write_zeroes_max_bytes");
  QUEUE_RO_ENTRY(queue_zone_append_max, "zone_append_max_bytes");
+QUEUE_RO_ENTRY(queue_zone_write_granularity, "zone_write_granularity");
  
  QUEUE_RO_ENTRY(queue_zoned, "zoned");
  QUEUE_RO_ENTRY(queue_nr_zones, "nr_zones");
@@ -639,6 +646,7 @@ static struct attribute *queue_attrs[] = {
         &queue_write_same_max_entry.attr,
         &queue_write_zeroes_max_entry.attr,
         &queue_zone_append_max_entry.attr,
+       &queue_zone_write_granularity_entry.attr,
         &queue_nonrot_entry.attr,
         &queue_zoned_entry.attr,
         &queue_nr_zones_entry.attr,
diff --git a/drivers/scsi/sd_zbc.c b/drivers/scsi/sd_zbc.c

index cf07b7f9357906d875ffd7e3dda16c66b221f49a..8293b29584b336090dff56f14d8262ab03d5b98c 100644 (file)
--- a/drivers/scsi/sd_zbc.c
+++ b/drivers/scsi/sd_zbc.c
@@ -789,6 +789,14 @@ int sd_zbc_read_zones(struct scsi_disk *sdkp, unsigned char *buf)
         blk_queue_max_active_zones(q, 0);
         nr_zones = round_up(sdkp->capacity, zone_blocks) >> ilog2(zone_blocks);
  
+       /*
+        * Per ZBC and ZAC specifications, writes in sequential write required
+        * zones of host-managed devices must be aligned to the device physical
+        * block size.
+        */
+       if (blk_queue_zoned_model(q) == BLK_ZONED_HM)
+               blk_queue_zone_write_granularity(q, sdkp->physical_block_size);
+
         /* READ16/WRITE16 is mandatory for ZBC disks */
         sdkp->device->use_16_for_rw = 1;
         sdkp->device->use_10_for_rw = 0;
diff --git a/include/linux/blkdev.h b/include/linux/blkdev.h

index 0dea268bd61bb1bc7ecc8fe928c78e50addbec75..9149f4a5adb36eb2f112ec86e664ac321904e62d 100644 (file)
--- a/include/linux/blkdev.h
+++ b/include/linux/blkdev.h
@@ -337,6 +337,7 @@ struct queue_limits {
         unsigned int            max_zone_append_sectors;
         unsigned int            discard_granularity;
         unsigned int            discard_alignment;
+       unsigned int            zone_write_granularity;
  
         unsigned short          max_segments;
         unsigned short          max_integrity_segments;
@@ -1160,6 +1161,8 @@ extern void blk_queue_logical_block_size(struct request_queue *, unsigned int);
  extern void blk_queue_max_zone_append_sectors(struct request_queue *q,
                 unsigned int max_zone_append_sectors);
  extern void blk_queue_physical_block_size(struct request_queue *, unsigned int);
+void blk_queue_zone_write_granularity(struct request_queue *q,
+                                     unsigned int size);
  extern void blk_queue_alignment_offset(struct request_queue *q,
                                        unsigned int alignment);
  void blk_queue_update_readahead(struct request_queue *q);
@@ -1473,6 +1476,18 @@ static inline int bdev_io_opt(struct block_device *bdev)
         return queue_io_opt(bdev_get_queue(bdev));
  }
  
+static inline unsigned int
+queue_zone_write_granularity(const struct request_queue *q)
+{
+       return q->limits.zone_write_granularity;
+}
+
+static inline unsigned int
+bdev_zone_write_granularity(struct block_device *bdev)
+{
+       return queue_zone_write_granularity(bdev_get_queue(bdev));
+}
+
  static inline int queue_alignment_offset(const struct request_queue *q)
  {
         if (q->limits.misaligned)
author	Damien Le Moal <damien.lemoal@wdc.com>
	Thu, 28 Jan 2021 04:47:30 +0000 (13:47 +0900)
committer	Jens Axboe <axboe@kernel.dk>
	Wed, 10 Feb 2021 14:44:40 +0000 (07:44 -0700)
Documentation/block/queue-sysfs.rst		patch \| blob \| history
block/blk-settings.c		patch \| blob \| history
block/blk-sysfs.c		patch \| blob \| history
drivers/scsi/sd_zbc.c		patch \| blob \| history
include/linux/blkdev.h		patch \| blob \| history