在xarray中按单个维度的多个坐标分组

问题描述

我有一个沿一维具有多个坐标的xarray。在下面的示例中,坐标ab是沿着维度dim1定义的。我如何groupby使用沿相同维度定义的两个坐标?与this question不同,我不是尝试沿着不同的维度分组,而是沿着单个维度进行分组。

import xarray as xr

d = xr.DataArray([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]],
    coords={
        'a': ('dim1',['A', 'A', 'B', 'B']),
        'b': ('dim1',['1', '2', '1', '2']),
        'c': ('dim2',['x', 'y', 'z'])
    },
    dims=['dim1', 'dim2'])
d.groupby(['a','b']) # this gives: TypeError: `group` must be an xarray.DataArray or the name of an xarray variable or dimension

解决方案

这是我当前的解决方法:

import numpy as np
import xarray as xr

def groupby_multicoords(da, fields):
    common_dim = da.coords[fields[0]].dims[0]
    tups_arr = np.empty(len(da[common_dim]), dtype=object)
    tups_arr[:] = list(zip(*(da[f].values for f in fields)))
    return da.assign_coords(grouping_zip=xr.DataArray(tups_arr, dims=common_dim)).groupby('grouping_zip')

然后groupby_multicoords(da=d, fields=['a', 'b'])

但是,在分组之后,我仍然使用"grouping_zip"坐标。如将其替换为d.groupby(['a','b'])..

,我将不胜感激

相关文章