将Avro二进制字符串转换为Json

2022-04-27 00:00:00 avro java

我有一个Avro二进制格式的字符串。我想将字符串转换为json。有谁能给我带路吗?我尝试使用在线提供的解决方案,但不起作用。

public String avroToJson(byte[] avro) throws IOException {
        boolean pretty = false;
        GenericDatumReader<GenericRecord> reader = null;
        JsonEncoder encoder = null;
        ByteArrayOutputStream output = null;
        try {
            reader = new GenericDatumReader<GenericRecord>();
            InputStream input = new ByteArrayInputStream(avro);
            DataFileStream<GenericRecord> streamReader = new DataFileStream<GenericRecord>(input, reader);
            output = new ByteArrayOutputStream();
            Schema schema = streamReader.getSchema();
            DatumWriter<GenericRecord> writer = new GenericDatumWriter<GenericRecord>(schema);
            encoder = EncoderFactory.get().jsonEncoder(schema, output, pretty);
            for (GenericRecord datum : streamReader) {
                writer.write(datum, encoder);
            }
            encoder.flush();
            output.flush();
            return new String(output.toByteArray());
        } finally {
            try {
                if (output != null) output.close();
            } catch (Exception e) {
            }
        }
    }
我使用getBytes()将我的字符串转换为字节数组,并将其传递给此函数。我得到了这个例外。 线程"main"org.apache.avro.InvalidAvroMagicException中出现异常:不是Avro数据文件。


解决方案

avro指定了一种二进制格式来序列化一个对象,但也指定了一个Object Container File(也称为数据文件),它可以以一种有用的方式保存许多对象以便于文件访问。

DataFileStream需要容器文件,但从您的描述看,您似乎只有一个序列化的实例。

您可能需要如下内容:

  public String avroToJson(Schema schema, byte[] avroBinary) throws IOException {
    // byte to datum
    DatumReader<Object> datumReader = new GenericDatumReader<>(schema);
    Decoder decoder = DecoderFactory.get().binaryDecoder(avroBinary, null);
    Object avroDatum = datumReader.read(null, decoder);

    // datum to json
    String json = null;
    try (ByteArrayOutputStream baos = new ByteArrayOutputStream()) {
      DatumWriter<Object> writer = new GenericDatumWriter<>(schema);
      JsonEncoder encoder = EncoderFactory.get().jsonEncoder(schema, baos, false);
      writer.write(avroDatum, encoder);
      encoder.flush();
      baos.flush();
      return new String(baos.toByteArray(), StandardCharsets.UTF_8);
    }
  }

请注意,这意味着您必须事先知道架构才能反序列化二进制数据。如果是Avro数据文件,则可以从文件元数据中获取架构。

相关文章