amd/common: Add modifier tests.

This primarily tests that: - multiple GPUs with the same GPU modifier parameters result in the same tiling layout. - The size & alignment calculations don't change for a given modifier & image parameters. It does this primarily based on addrlib. Radeonsi has used addrlib for the retiling of displayable DCC for a while already, so the DCC tiling should be pretty reliable. Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/6176>
2024-11-24 02:34:17 +08:00 · 2019-10-15 00:09:08 +02:00 · 2019-10-15 00:09:08 +02:00 · 395dac7bf9
commit 395dac7bf9
parent 0833dd7d12
4 changed files with 596 additions and 1 deletions
--- a/src/amd/common/ac_surface.c
+++ b/src/amd/common/ac_surface.c
@ -678,6 +678,11 @@ void ac_addrlib_destroy(struct ac_addrlib *addrlib)
   free(addrlib);
 }

+void *ac_addrlib_get_handle(struct ac_addrlib *addrlib)
+{
+   return addrlib->handle;
+}
+
 static int surf_config_sanity(const struct ac_surf_config *config, unsigned flags)
 {
   /* FMASK is allocated together with the color surface and can't be
--- a/src/amd/common/ac_surface.h
+++ b/src/amd/common/ac_surface.h
@ -299,6 +299,7 @@ struct ac_addrlib *ac_addrlib_create(const struct radeon_info *info,
                                     const struct amdgpu_gpu_info *amdinfo,
                                     uint64_t *max_alignment);
 void ac_addrlib_destroy(struct ac_addrlib *addrlib);
+void *ac_addrlib_get_handle(struct ac_addrlib *addrlib);

 int ac_compute_surface(struct ac_addrlib *addrlib, const struct radeon_info *info,
                       const struct ac_surf_config *config, enum radeon_surf_mode mode,
--- a/src/amd/common/ac_surface_modifier_test.c
+++ b/src/amd/common/ac_surface_modifier_test.c
@ -0,0 +1,574 @@
+ /* Make the test not meaningless when asserts are disabled. */
+#undef NDEBUG
+
+#include <assert.h>
+#include <inttypes.h>
+#include <stdio.h>
+#include <stdlib.h>
+
+#include <amdgpu.h>
+#include "drm-uapi/amdgpu_drm.h"
+#include "drm-uapi/drm_fourcc.h"
+
+#include "ac_gpu_info.h"
+#include "ac_surface.h"
+#include "util/macros.h"
+#include "util/u_math.h"
+#include "util/u_vector.h"
+#include "util/mesa-sha1.h"
+#include "addrlib/inc/addrinterface.h"
+#include "amdgfxregs.h"
+
+/*
+ * The main goal of this test is making sure that we do
+ * not change the meaning of existing modifiers.
+ */
+
+
+typedef void (*gpu_init_func)(struct radeon_info *info);
+
+static void init_vega10(struct radeon_info *info)
+{
+   info->family = CHIP_VEGA10;
+   info->chip_class = GFX9;
+   info->family_id = AMDGPU_FAMILY_AI;
+   info->chip_external_rev = 0x01;
+   info->use_display_dcc_unaligned = false;
+   info->use_display_dcc_with_retile_blit = false;
+   info->has_graphics = true;
+   info->tcc_cache_line_size = 64;
+
+   info->gb_addr_config = 0x2a114042;
+}
+
+static void init_vega20(struct radeon_info *info)
+{
+   info->family = CHIP_VEGA20;
+   info->chip_class = GFX9;
+   info->family_id = AMDGPU_FAMILY_AI;
+   info->chip_external_rev = 0x30;
+   info->use_display_dcc_unaligned = false;
+   info->use_display_dcc_with_retile_blit = false;
+   info->has_graphics = true;
+   info->tcc_cache_line_size = 64;
+
+   info->gb_addr_config = 0x2a114042;
+}
+
+
+static void init_raven(struct radeon_info *info)
+{
+   info->family = CHIP_RAVEN;
+   info->chip_class = GFX9;
+   info->family_id = AMDGPU_FAMILY_RV;
+   info->chip_external_rev = 0x01;
+   info->use_display_dcc_unaligned = false;
+   info->use_display_dcc_with_retile_blit = true;
+   info->has_graphics = true;
+   info->tcc_cache_line_size = 64;
+
+   info->gb_addr_config = 0x24000042;
+}
+
+static void init_raven2(struct radeon_info *info)
+{
+   info->family = CHIP_RAVEN2;
+   info->chip_class = GFX9;
+   info->family_id = AMDGPU_FAMILY_RV;
+   info->chip_external_rev = 0x82;
+   info->use_display_dcc_unaligned = true;
+   info->use_display_dcc_with_retile_blit = false;
+   info->has_graphics = true;
+   info->tcc_cache_line_size = 64;
+
+   info->gb_addr_config = 0x26013041;
+}
+
+static void init_navi10(struct radeon_info *info)
+{
+   info->family = CHIP_NAVI10;
+   info->chip_class = GFX10;
+   info->family_id = AMDGPU_FAMILY_NV;
+   info->chip_external_rev = 3;
+   info->use_display_dcc_unaligned = false;
+   info->use_display_dcc_with_retile_blit = false;
+   info->has_graphics = true;
+   info->tcc_cache_line_size = 128;
+
+   info->gb_addr_config = 0x00100044;
+}
+
+static void init_navi14(struct radeon_info *info)
+{
+   info->family = CHIP_NAVI14;
+   info->chip_class = GFX10;
+   info->family_id = AMDGPU_FAMILY_NV;
+   info->chip_external_rev = 0x15;
+   info->use_display_dcc_unaligned = false;
+   info->use_display_dcc_with_retile_blit = false;
+   info->has_graphics = true;
+   info->tcc_cache_line_size = 128;
+
+   info->gb_addr_config = 0x00000043;
+}
+
+
+struct test_entry {
+   /* key part */
+   uint64_t modifier;
+   unsigned w;
+   unsigned h;
+   enum pipe_format format;
+
+   /* debug info */
+   const char *name;
+   uint8_t pipes;
+   uint8_t rb;
+   uint8_t banks_or_pkrs;
+   uint8_t se;
+
+   /* value to determine uniqueness */
+   unsigned char hash[20];
+
+   /* u_vector requires power of two sizing */
+   char padding[8];
+};
+
+static uint64_t
+block_count(unsigned w, unsigned h, unsigned elem_bits, unsigned block_bits,
+            unsigned *aligned_pitch, unsigned *aligned_height)
+{
+   unsigned align_bits = block_bits - elem_bits;
+   unsigned w_align = 1 << (align_bits / 2 + align_bits % 2);
+   unsigned h_align = 1 << (align_bits / 2);
+
+   w = align(w, w_align);
+   h = align(h, h_align);
+
+   if (aligned_pitch)
+      *aligned_pitch = w;
+
+   if (aligned_height)
+      *aligned_height = h;
+   return ((uint64_t)w * h) >> align_bits;
+}
+
+
+static ADDR2_COMPUTE_DCC_ADDRFROMCOORD_INPUT
+get_addr_from_coord_base(ADDR_HANDLE addrlib, const struct radeon_surf *surf,
+                         unsigned w, unsigned h, enum pipe_format format,
+                         bool rb_aligned, bool pipe_aligned)
+{
+   ADDR2_COMPUTE_DCCINFO_INPUT din = {0};
+   ADDR2_COMPUTE_DCCINFO_OUTPUT dout = {0};
+   din.size = sizeof(ADDR2_COMPUTE_DCCINFO_INPUT);
+   dout.size = sizeof(ADDR2_COMPUTE_DCCINFO_OUTPUT);
+
+   din.swizzleMode = surf->u.gfx9.surf.swizzle_mode;
+   din.resourceType = ADDR_RSRC_TEX_2D;
+   din.bpp = util_format_get_blocksizebits(format);
+   din.unalignedWidth = w;
+   din.unalignedHeight = h;
+   din.numSlices = 1;
+   din.numMipLevels = 1;
+   din.numFrags = 1;
+   din.dccKeyFlags.pipeAligned = surf->u.gfx9.dcc.pipe_aligned;
+   din.dccKeyFlags.rbAligned = surf->u.gfx9.dcc.rb_aligned;
+   din.dataSurfaceSize = surf->surf_size;
+
+   ADDR_E_RETURNCODE ret = Addr2ComputeDccInfo(addrlib, &din, &dout);
+   assert(ret == ADDR_OK);
+
+   ADDR2_COMPUTE_DCC_ADDRFROMCOORD_INPUT dcc_input = {0};
+   dcc_input.size = sizeof(dcc_input);
+   dcc_input.swizzleMode = surf->u.gfx9.surf.swizzle_mode;
+   dcc_input.resourceType = ADDR_RSRC_TEX_2D;
+   dcc_input.bpp = din.bpp;
+   dcc_input.numSlices = 1;
+   dcc_input.numMipLevels = 1;
+   dcc_input.numFrags = 1;
+   dcc_input.dccKeyFlags.pipeAligned = pipe_aligned;
+   dcc_input.dccKeyFlags.rbAligned = rb_aligned;
+   dcc_input.pitch = dout.pitch;
+   dcc_input.height = dout.height;
+   dcc_input.compressBlkWidth = dout.compressBlkWidth;
+   dcc_input.compressBlkHeight = dout.compressBlkHeight;
+   dcc_input.compressBlkDepth = dout.compressBlkDepth;
+   dcc_input.metaBlkWidth     = dout.metaBlkWidth;
+   dcc_input.metaBlkHeight    = dout.metaBlkHeight;
+   dcc_input.metaBlkDepth     = dout.metaBlkDepth;
+   return dcc_input;
+}
+
+static
+void generate_hash(struct ac_addrlib *ac_addrlib,
+                   struct test_entry *entry,
+                   const struct radeon_surf *surf)
+{
+   ADDR_HANDLE addrlib = ac_addrlib_get_handle(ac_addrlib);
+
+   srandom(53);
+   struct mesa_sha1 ctx;
+   _mesa_sha1_init(&ctx);
+
+   _mesa_sha1_update(&ctx, &surf->total_size, sizeof(surf->total_size));
+   _mesa_sha1_update(&ctx, &surf->dcc_offset, sizeof(surf->dcc_offset));
+   _mesa_sha1_update(&ctx, &surf->display_dcc_offset, sizeof(surf->display_dcc_offset));
+   _mesa_sha1_update(&ctx, &surf->u.gfx9.display_dcc_pitch_max,
+                     sizeof(surf->u.gfx9.display_dcc_pitch_max));
+
+   ADDR2_COMPUTE_SURFACE_ADDRFROMCOORD_INPUT input = {0};
+   input.size = sizeof(input);
+   input.swizzleMode = surf->u.gfx9.surf.swizzle_mode;
+   input.resourceType = ADDR_RSRC_TEX_2D;
+   input.bpp = util_format_get_blocksizebits(entry->format);
+   input.unalignedWidth = entry->w;
+   input.unalignedHeight = entry->h;
+   input.numSlices = 1;
+   input.numMipLevels = 1;
+   input.numSamples = 1;
+   input.numFrags = 1;
+   input.pitchInElement = surf->u.gfx9.surf_pitch;
+
+   ADDR2_COMPUTE_DCC_ADDRFROMCOORD_INPUT dcc_input = {0};
+   if (surf->dcc_offset) {
+      dcc_input = get_addr_from_coord_base(addrlib, surf, entry->w,
+                                           entry->h, entry->format,
+                                           surf->u.gfx9.dcc.rb_aligned,
+                                           surf->u.gfx9.dcc.pipe_aligned);
+   }
+
+   ADDR2_COMPUTE_DCC_ADDRFROMCOORD_INPUT display_dcc_input = {0};
+   if (surf->display_dcc_offset) {
+      display_dcc_input = get_addr_from_coord_base(addrlib, surf, entry->w,
+                                                   entry->h, entry->format,
+                                                   false, false);
+   }
+
+   for (unsigned i = 0; i < 1000; ++i) {
+      int32_t x, y;
+      x = random();
+      y = random();
+
+      input.x = (x & INT_MAX) % entry->w;
+      input.y = (y & INT_MAX) % entry->h;
+
+      ADDR2_COMPUTE_SURFACE_ADDRFROMCOORD_OUTPUT output = {0};
+      output.size = sizeof(output);
+
+      ADDR_E_RETURNCODE ret = Addr2ComputeSurfaceAddrFromCoord(addrlib, &input, &output);
+      assert(ret == ADDR_OK);
+
+      _mesa_sha1_update(&ctx, &output.addr, sizeof(output.addr));
+
+      if (surf->dcc_offset) {
+         dcc_input.x = (x & INT_MAX) % entry->w;
+         dcc_input.y = (y & INT_MAX) % entry->h;
+
+         ADDR2_COMPUTE_DCC_ADDRFROMCOORD_OUTPUT dcc_output = {0};
+         dcc_output.size = sizeof(dcc_output);
+
+         ret = Addr2ComputeDccAddrFromCoord(addrlib, &dcc_input, &dcc_output);
+         assert(ret == ADDR_OK);
+
+         _mesa_sha1_update(&ctx, &dcc_output.addr, sizeof(dcc_output.addr));
+      }
+
+      if (surf->display_dcc_offset) {
+         display_dcc_input.x = (x & INT_MAX) % entry->w;
+         display_dcc_input.y = (y & INT_MAX) % entry->h;
+
+         ADDR2_COMPUTE_DCC_ADDRFROMCOORD_OUTPUT dcc_output = {0};
+         dcc_output.size = sizeof(dcc_output);
+
+         ret = Addr2ComputeDccAddrFromCoord(addrlib, &display_dcc_input, &dcc_output);
+         assert(ret == ADDR_OK);
+
+         _mesa_sha1_update(&ctx, &dcc_output.addr, sizeof(dcc_output.addr));
+      }
+   }
+
+   _mesa_sha1_final(&ctx, entry->hash);
+}
+
+static void test_modifier(const struct radeon_info *info,
+                          const struct amdgpu_gpu_info *amdinfo,
+           const char *name,
+                          struct ac_addrlib *addrlib,
+                          uint64_t modifier,
+           enum pipe_format format,
+                          struct u_vector *test_entries)
+{
+   unsigned elem_bits = util_logbase2(util_format_get_blocksize(format));
+   const unsigned dims[][2] = {
+      {1, 1},
+      {1920, 1080},
+      {1366, 768},
+      {3840, 2160},
+      {233, 938},
+   };
+   for (unsigned i = 0; i < ARRAY_SIZE(dims); ++i) {
+      struct ac_surf_config config = (struct ac_surf_config) {
+         .info = (struct ac_surf_info) {
+            .width = dims[i][0],
+            .height = dims[i][1],
+            .depth = 1,
+            .samples = 1,
+            .storage_samples = 1,
+            .levels = 1,
+            .num_channels = 3,
+            .array_size = 1
+         },
+      };
+
+      struct test_entry entry = {
+         .modifier = modifier,
+         .w = config.info.width,
+         .h = config.info.height,
+         .format = format,
+         .name = name,
+         .pipes = G_0098F8_NUM_PIPES(info->gb_addr_config),
+         .rb = G_0098F8_NUM_RB_PER_SE(info->gb_addr_config) +
+               G_0098F8_NUM_SHADER_ENGINES_GFX9(info->gb_addr_config),
+         .se = G_0098F8_NUM_SHADER_ENGINES_GFX9(info->gb_addr_config),
+         .banks_or_pkrs = info->chip_class >= GFX10 ?
+            (info->gb_addr_config) : G_0098F8_NUM_BANKS(info->gb_addr_config)
+      };
+
+      struct radeon_surf surf = (struct radeon_surf) {
+         .blk_w = 1,
+         .blk_h = 1,
+         .bpe = util_format_get_blocksize(format),
+         .modifier = modifier,
+      };
+
+      int r = ac_compute_surface(addrlib, info, &config, RADEON_SURF_MODE_2D, &surf);
+      assert(!r);
+
+      assert(surf.htile_offset == 0);
+      assert(surf.cmask_offset == 0);
+      assert(surf.fmask_offset == 0);
+
+      uint64_t surf_size;
+      unsigned aligned_pitch, aligned_height;
+      if (modifier != DRM_FORMAT_MOD_LINEAR) {
+         surf_size = block_count(dims[i][0], dims[i][1],
+                  elem_bits, 16, &aligned_pitch,
+                  &aligned_height) << 16;
+      } else {
+         aligned_pitch = align(dims[i][0], 256 / util_format_get_blocksize(format));
+         aligned_height = dims[i][1];
+         surf_size = align(dims[i][0] * util_format_get_blocksize(format), 256) * dims[i][1];
+      }
+
+
+      assert(surf.u.gfx9.surf_pitch == aligned_pitch);
+      assert(surf.u.gfx9.surf_height == aligned_height);
+      assert(surf.surf_size == surf_size);
+      uint64_t expected_offset = surf_size;
+
+      if (ac_modifier_has_dcc_retile(modifier)) {
+         unsigned dcc_align = info->chip_class >= GFX10 ? 4096 : 65536;
+         unsigned dcc_pitch;
+         uint64_t dcc_size = block_count(dims[i][0], dims[i][1],
+                     elem_bits, 20, &dcc_pitch,
+                     NULL) << 12;
+
+         assert(surf.u.gfx9.display_dcc_size == align(dcc_size, dcc_align));
+         assert(surf.u.gfx9.display_dcc_pitch_max + 1 == dcc_pitch);
+         assert(surf.display_dcc_offset == expected_offset);
+
+         expected_offset += align(dcc_size, dcc_align);
+      } else
+         assert(!surf.display_dcc_offset);
+
+      if (ac_modifier_has_dcc(modifier)) {
+         uint64_t dcc_align = 1;
+         unsigned block_bits;
+         if (info->chip_class >= GFX10) {
+            unsigned num_pipes = G_0098F8_NUM_PIPES(amdinfo->gb_addr_cfg);
+            if (info->chip_class == GFX10_3 &&
+                G_0098F8_NUM_PKRS(amdinfo->gb_addr_cfg) == num_pipes && num_pipes > 1)
+               ++num_pipes;
+            block_bits = 16 +
+               num_pipes +
+               G_0098F8_PIPE_INTERLEAVE_SIZE_GFX9(amdinfo->gb_addr_cfg);
+            block_bits = MAX2(block_bits, 20);
+            dcc_align = MAX2(4096, 256 <<
+                                  (num_pipes +
+                                   G_0098F8_PIPE_INTERLEAVE_SIZE_GFX9(amdinfo->gb_addr_cfg)));
+         } else {
+            block_bits = 18 +
+               G_0098F8_NUM_RB_PER_SE(amdinfo->gb_addr_cfg) +
+               G_0098F8_NUM_SHADER_ENGINES_GFX9(amdinfo->gb_addr_cfg);
+            block_bits = MAX2(block_bits, 20);
+            dcc_align = 65536;
+         }
+
+         expected_offset = align(expected_offset, dcc_align);
+         assert(surf.dcc_offset == expected_offset);
+
+         uint64_t dcc_size = block_count(dims[i][0], dims[i][1],
+                     elem_bits, block_bits,
+                     NULL, NULL) << (block_bits - 8);
+         dcc_size = align64(dcc_size, dcc_align);
+         assert(surf.dcc_size == dcc_size);
+
+         expected_offset += dcc_size;
+      } else
+         assert(!surf.dcc_offset);
+
+      assert(surf.total_size == expected_offset);
+
+      generate_hash(addrlib, &entry, &surf);
+      *(struct test_entry*)u_vector_add(test_entries) = entry;
+   }
+
+}
+
+static void run_gpu_test(struct u_vector *test_entries, const char *name, const struct radeon_info *info)
+{
+   struct amdgpu_gpu_info amdinfo = {
+      .gb_addr_cfg = info->gb_addr_config
+   };
+
+   struct ac_addrlib *addrlib = ac_addrlib_create(info, &amdinfo, NULL);
+   assert(addrlib);
+
+   const struct ac_modifier_options options = {
+      .dcc = true,
+      .dcc_retile = true,
+   };
+
+   enum pipe_format formats[] = {
+      PIPE_FORMAT_R8_UNORM,
+      PIPE_FORMAT_R16_UNORM,
+      PIPE_FORMAT_R32_FLOAT,
+      PIPE_FORMAT_R32G32_FLOAT,
+      PIPE_FORMAT_R32G32B32A32_FLOAT
+   };
+   for (unsigned j = 0; j < ARRAY_SIZE(formats); ++j) {
+      unsigned mod_count = 0;
+      ac_get_supported_modifiers(info, &options, formats[j], &mod_count, NULL);
+
+      uint64_t *modifiers = malloc(sizeof(uint64_t) * mod_count);
+      ac_get_supported_modifiers(info, &options, formats[j], &mod_count, modifiers);
+
+      for (unsigned i = 0; i < mod_count; ++i) {
+         test_modifier(info, &amdinfo, name, addrlib, modifiers[i], formats[j], test_entries);
+      }
+
+      free(modifiers);
+   }
+   ac_addrlib_destroy(addrlib);
+}
+
+static int compare_test_entry(const void *a, const void *b)
+{
+   return memcmp(a, b, sizeof(struct test_entry));
+}
+
+static bool test_entry_key_equal(const struct test_entry *a, const struct test_entry *b)
+{
+   return a->modifier == b->modifier && a->w == b->w && a->h == b->h && a->format == b->format;
+}
+
+static bool test_entry_value_equal(const struct test_entry *a, const struct test_entry *b)
+{
+   if (memcmp(a->hash, b->hash, sizeof(a->hash)))
+      return false;
+   return true;
+}
+
+static void print_test_entry(const struct test_entry *e)
+{
+   printf("%.16" PRIx64 " %.4d %.4d %.2d %s %d %d %d %d\n", e->modifier, e->w, e->h,
+          util_format_get_blocksize(e->format), e->name, e->pipes, e->rb, e->se, e->banks_or_pkrs);
+}
+
+int main()
+{
+   struct u_vector test_entries;
+   u_vector_init(&test_entries,  util_next_power_of_two(sizeof(struct test_entry)), 4096);
+
+   struct testcase {
+      const char *name;
+      gpu_init_func init;
+      int banks_or_pkrs;
+      int pipes;
+      int se;
+      int rb_per_se;
+   } testcases[] = {
+      {"vega10", init_vega10, 4, 2, 2, 2},
+      {"vega10_diff_bank", init_vega10, 3, 2, 2, 2},
+      {"vega10_diff_rb", init_vega10, 4, 2, 2, 0},
+      {"vega10_diff_pipe", init_vega10, 4, 0, 2, 2},
+      {"vega10_diff_se", init_vega10, 4, 2, 1, 2},
+      {"vega20", init_vega20, 4, 2, 2, 2},
+      {"raven", init_raven, 0, 2, 0, 1},
+      {"raven2", init_raven2, 3, 1, 0, 1},
+      {"navi10", init_navi10, 0, 4, 1, 0},
+      {"navi10_diff_pipe", init_navi10, 0, 3, 1, 0},
+      {"navi10_diff_pkr", init_navi10, 1, 4, 1, 0},
+      {"navi14", init_navi14, 1, 3, 1, 0}
+   };
+
+   for (unsigned i = 0; i < ARRAY_SIZE(testcases); ++i) {
+      struct radeon_info info = {
+         .drm_major = 3,
+         .drm_minor = 30,
+      };
+
+      testcases[i].init(&info);
+
+      info.num_render_backends = 1u << (testcases[i].se +
+                                        testcases[i].rb_per_se);
+      switch(info.chip_class) {
+      case GFX10:
+      case GFX10_3:
+         info.gb_addr_config = (info.gb_addr_config &
+                                C_0098F8_NUM_PIPES &
+                                C_0098F8_NUM_PKRS) |
+                                S_0098F8_NUM_PIPES(testcases[i].pipes) |
+                                S_0098F8_NUM_PKRS(testcases[i].banks_or_pkrs);
+         break;
+      case GFX9:
+         info.gb_addr_config = (info.gb_addr_config &
+                                C_0098F8_NUM_PIPES &
+                                C_0098F8_NUM_BANKS &
+                                C_0098F8_NUM_SHADER_ENGINES_GFX9 &
+                                C_0098F8_NUM_RB_PER_SE) |
+                                S_0098F8_NUM_PIPES(testcases[i].pipes) |
+                                S_0098F8_NUM_BANKS(testcases[i].banks_or_pkrs) |
+                                S_0098F8_NUM_SHADER_ENGINES_GFX9(testcases[i].se) |
+                                S_0098F8_NUM_RB_PER_SE(testcases[i].rb_per_se);
+         break;
+      default:
+         unreachable("Unhandled generation");
+      }
+      run_gpu_test(&test_entries, testcases[i].name, &info);
+   }
+
+   qsort(u_vector_tail(&test_entries),
+         u_vector_length(&test_entries),
+         sizeof(struct test_entry),
+         compare_test_entry);
+
+   struct test_entry *cur, *prev = NULL, *prevprev = NULL;
+   bool mismatched_duplicates = false;
+   u_vector_foreach(cur, &test_entries) {
+      if (prev && test_entry_key_equal(cur, prev) &&
+          !test_entry_value_equal(cur, prev)) {
+         if (!prevprev || !test_entry_key_equal(prev, prevprev)) {
+            print_test_entry(prev);
+         }
+         print_test_entry(cur);
+         mismatched_duplicates = true;
+      }
+      prevprev = prev;
+      prev = cur;
+   }
+   assert(!mismatched_duplicates);
+
+   return 0;
+}
--- a/src/amd/common/meson.build
+++ b/src/amd/common/meson.build
@ -90,9 +90,24 @@ libamd_common = static_library(
  ],
  dependencies : [
    dep_thread, dep_elf, dep_libdrm_amdgpu, dep_valgrind,
-    idep_nir_headers,
+    idep_mesautil, idep_nir_headers
  ],
  gnu_symbol_visibility : 'hidden',
 )

 idep_amdgfxregs_h = declare_dependency(sources : [amdgfxregs_h])
+
+
+test(
+  'ac_surface_modifier_test',
+  executable(
+    'ac_surface_modifier_test',
+    ['ac_surface_modifier_test.c'],
+    link_with: [libamd_common, libamdgpu_addrlib],
+    include_directories : [
+      inc_amd, inc_gallium, inc_include, inc_src,
+    ],
+    dependencies: [idep_amdgfxregs_h, dep_libdrm_amdgpu],
+  ),
+  suite: ['amd']
+)