如何在Java中从avro文件中提取模式

2022-04-27 00:00:00 avro java avro-tools
如何在Java中首先从Avro文件提取模式,然后从Avro文件中提取数据?与this问题相同,但在Java中除外。

我见过如何从AVSC文件而不是avro文件获取模式的示例。我应该朝哪个方向看?

Schema schema = new Schema.Parser().parse(
    new File("/home/Hadoop/Avro/schema/emp.avsc")
);

解决方案

如果您想知道avro文件的架构,而不必生成相应的类或关心该文件属于哪个类,则可以使用GenericDatumReader

DatumReader<GenericRecord> datumReader = new GenericDatumReader<>();
DataFileReader<GenericRecord> dataFileReader = new DataFileReader<>(new File("file.avro"), datumReader);
Schema schema = dataFileReader.getSchema();
System.out.println(schema);

然后您可以读取文件中的数据:

GenericRecord record = null;
while (dataFileReader.hasNext()) {
    record = dataFileReader.next(record);
    System.out.println(record);
}

相关文章