将Avro二进制字符串转换为Json
我有一个Avro二进制格式的字符串。我想将字符串转换为json。有谁能给我带路吗?我尝试使用在线提供的解决方案,但不起作用。
public String avroToJson(byte[] avro) throws IOException {
boolean pretty = false;
GenericDatumReader<GenericRecord> reader = null;
JsonEncoder encoder = null;
ByteArrayOutputStream output = null;
try {
reader = new GenericDatumReader<GenericRecord>();
InputStream input = new ByteArrayInputStream(avro);
DataFileStream<GenericRecord> streamReader = new DataFileStream<GenericRecord>(input, reader);
output = new ByteArrayOutputStream();
Schema schema = streamReader.getSchema();
DatumWriter<GenericRecord> writer = new GenericDatumWriter<GenericRecord>(schema);
encoder = EncoderFactory.get().jsonEncoder(schema, output, pretty);
for (GenericRecord datum : streamReader) {
writer.write(datum, encoder);
}
encoder.flush();
output.flush();
return new String(output.toByteArray());
} finally {
try {
if (output != null) output.close();
} catch (Exception e) {
}
}
}
我使用getBytes()将我的字符串转换为字节数组,并将其传递给此函数。我得到了这个例外。
线程"main"org.apache.avro.InvalidAvroMagicException中出现异常:不是Avro数据文件。
解决方案
avro指定了一种二进制格式来序列化一个对象,但也指定了一个Object Container File(也称为数据文件),它可以以一种有用的方式保存许多对象以便于文件访问。
DataFileStream
需要容器文件,但从您的描述看,您似乎只有一个序列化的实例。
您可能需要如下内容:
public String avroToJson(Schema schema, byte[] avroBinary) throws IOException {
// byte to datum
DatumReader<Object> datumReader = new GenericDatumReader<>(schema);
Decoder decoder = DecoderFactory.get().binaryDecoder(avroBinary, null);
Object avroDatum = datumReader.read(null, decoder);
// datum to json
String json = null;
try (ByteArrayOutputStream baos = new ByteArrayOutputStream()) {
DatumWriter<Object> writer = new GenericDatumWriter<>(schema);
JsonEncoder encoder = EncoderFactory.get().jsonEncoder(schema, baos, false);
writer.write(avroDatum, encoder);
encoder.flush();
baos.flush();
return new String(baos.toByteArray(), StandardCharsets.UTF_8);
}
}
请注意,这意味着您必须事先知道架构才能反序列化二进制数据。如果是Avro数据文件,则可以从文件元数据中获取架构。
相关文章