如何在Java中从avro文件中提取模式
如何在Java中首先从Avro文件提取模式,然后从Avro文件中提取数据?与this问题相同,但在Java中除外。
我见过如何从AVSC文件而不是avro文件获取模式的示例。我应该朝哪个方向看?
Schema schema = new Schema.Parser().parse(
new File("/home/Hadoop/Avro/schema/emp.avsc")
);
解决方案
如果您想知道avro文件的架构,而不必生成相应的类或关心该文件属于哪个类,则可以使用GenericDatumReader
:
DatumReader<GenericRecord> datumReader = new GenericDatumReader<>();
DataFileReader<GenericRecord> dataFileReader = new DataFileReader<>(new File("file.avro"), datumReader);
Schema schema = dataFileReader.getSchema();
System.out.println(schema);
然后您可以读取文件中的数据:
GenericRecord record = null;
while (dataFileReader.hasNext()) {
record = dataFileReader.next(record);
System.out.println(record);
}
相关文章