Protocol Buffers
Protocol Buffers
Protocol Buffers API
Protocol Buffers
本教程使用proto3
版本的protocol buffers
语言,提供了一个基本的Go程序员使用protocol buffers
的介绍。通过创建一个简单的示例应用程序,展示如何:
.proto
文件中定义消息格式protocol buffers
编译器protocol buffers
API来编写和读取消息这不是在Go中使用protocol buffers
的综合指南。有关更详细的参考信息,请参阅“protocol buffers
语言指南”,“Go API参考”,“生成代码指南”和“编码参考”。
Protocol Buffers
将要使用的示例是一个非常简单的“地址簿”应用程序,可以在文件中读取和写入人员的详细信息。地址簿中的每个人都有姓名,ID,电子邮件地址和联系电话号码。
如何序列化和检索这样的结构化数据?有几种方法可以解决这个问题:
“12:3:-23:67”
。这是一种简单而灵活的方法,虽然它确实需要编写一次性编码和解析代码,并且解析会产生较小的运行时成本。这最适合编码非常简单的数据。XML
。这种方法非常有吸引力,因为XML
是人类可读的,并且对许多编程语言都有绑定库。如果想与其他应用程序/项目共享数据,这可能是一个不错的选择。然而,XML
是空间密集型,并且编码/解码它会对应用程序造成巨大的性能损失。此外,遍历一棵XML
的DOM
树比像通常那样在类中遍历简单字段要复杂得多。protocol buffers
是灵活,高效,自动化的解决方案,可以解决这个问题。使用protocol buffers
编写要存储的数据结构的.proto
描述文件。然后protocol buffers
编译器创建一个类,该类使用有效的二进制格式实现protocol buffers
数据的自动编码和解析。生成的类为构成protocol buffers
的字段提供getter
和setter
,并生成一个protocol buffers
,并将protocol buffers
作为一个单元读取和写入详细信息。重要的是,protocol buffers
格式支持扩展格式,使得代码仍然可以读取用旧格式编码的数据。
我们的示例是一组用于管理地址簿数据文件的命令行应用程序,使用protocol buffers
进行编码。命令add_person_go向数据文件添加新条目。命令list_people_go解析数据文件并将数据打印到控制台。
可以在GitHub存储库的examples目录中找到完整的示例。
要创建地址簿应用程序,需要从.proto
文件开始。.proto
文件中的定义很简单:为要序列化的每个数据结构添加消息,然后为消息中的每个字段指定名称和类型。在示例中,定义消息的.proto
文件是addressbook.proto
。
.proto
文件以包声明开头,这有助于防止不同项目之间的命名冲突。
syntax = "proto3";
package tutorial;
import "google/protobuf/timestamp.proto";
在Go中,包名称用作Go包,除非指定了go_package
。即使确实提供了go_package
,仍然应该定义一个普通的包,以避免在Protocol Buffers
名称空间和非Go语言中发生名称冲突。
接下来是消息定义。消息只是包含一组类型字段的聚合。许多标准的简单数据类型都可用作字段类型,包括bool
,int32
,float
,double
和string
。还可以使用其他消息类型作为字段类型,为消息添加更多结构。
message Person {
string name = 1;
int32 id = 2; // Unique ID number for this person.
string email = 3;
enum PhoneType {
MOBILE = 0;
HOME = 1;
WORK = 2;
}
message PhoneNumber {
string number = 1;
PhoneType type = 2;
}
repeated PhoneNumber phones = 4;
google.protobuf.Timestamp last_updated = 5;
}
// Our address book file is just one of these.
message AddressBook {
repeated Person people = 1;
}
在上面的示例中,Person
消息包含PhoneNumber
消息,而AddressBook
消息包含Person
消息。
PhoneNumber
类型在Person
中定义。MOBILE
,HOME
或WORK
之一。每个元素上的“=1”
,“=2”
标识该字段在二进制编码中使用的唯一“标记”。标签号1-15
相对于更大数字的标签号需要少于一个字节来编码,因此作为优化,可以决定将这些标签用于常用或重复的元素,将标签16和更大数字的标签号留给不太常用的可选元素。重复字段中的每个元素都需要重新编码标记号,因此重复字段特别适合此优化。
如果未设置字段的值,则使用默认值:数字类型为零,字符串为空字符串,布尔型为false。对于嵌入式消息,默认值始终是消息的“默认实例”或“原型”,其中没有设置其字段。调用访问器以获取尚未显式设置的字段的值始终返回该字段的默认值。
对于重复字段,该字段可以重复任意次数(包括零)。重复值的顺序将保留在protocol buffers
中。将重复字段视为动态数组。
在Protocol Buffer指南
中找到编写.proto
文件的完整指南,包括所有可能的字段类型。不要去寻找类继承这样的工具,protocol buffers
不会这样做。
Protocol Buffers
既然有一个.proto
文件,需要做的下一件事是生成读取和写入AddressBook
(以及Person
和PhoneNumber
)消息所需的类。为此,需要在.proto
上运行protocol buffers
编译器protoc
:
运行以下命令安装Go protocol buffers
插件
go get -u github.com/golang/protobuf/protoc-gen-go
编译器插件protoc-gen-go
将被安装在$GOBIN
中,默认为$GOPATH/bin
。该路径必须在$PATH
中,协议编译器protoc
才能找到它。
现在运行编译器:
$SRC_DIR
相同),.proto
的路径。如下所示:
protoc -I=$SRC_DIR --go_out=$DST_DIR $SRC_DIR/addressbook.proto
因为需要Go类,所以使用--go_out
选项,其他支持的语言也可以提供类似的选项。
这会在指定的目标目录($DST_DIR
)中生成addressbook.pb.go
。
Protocol Buffers API
生成的addressbook.pb.go
提供以下有用类型:
People
字段的AddressBook
结构体。Name
,Id
,Email
和Phones
字段的Person
结构体。Person_PhoneNumber
结构体,包含Number
和Type
字段。Person_PhoneType
类型和为Person.PhoneType
枚举中的每个值定义的值。可以阅读更多有关“生成代码”指南中生成的内容的详细信息,但在大多数情况下,可以将这些视为完全普通的Go类型。
这是list_people
命令关于如何创建Person
实例的单元测试的示例:
p := pb.Person{
Id: 1234,
Name: "John Doe",
Email: "jdoe@example.com",
Phones: []*pb.Person_PhoneNumber{
{Number: "555-4321", Type: pb.Person_HOME},
},
}
使用protocol buffers
的目的是序列化数据,以便可以在其他地方解析它。在Go中,使用proto
库的Marshal
函数来序列化protocol buffers
数据。指向protocol buffers
消息的struct
的指针实现了proto.Message
接口。调用proto.Marshal
会返回以传输格式编码的protocol buffers
。例如,在add_person
命令中使用此函数:
book := &pb.AddressBook{}
// ...
// Write the new address book back to disk.
out, err := proto.Marshal(book)
if err != nil {
log.Fatalln("Failed to encode address book:", err)
}
if err := ioutil.WriteFile(fname, out, 0644); err != nil {
log.Fatalln("Failed to write address book:", err)
}
要解析编码的消息,使用proto
库的Unmarshal
函数。调用它将buf
中的数据解析为protocol buffers
,并将结果放在pb
中。因此,要在list_people
命令中解析文件,我们使用:
// Read the existing address book.
in, err := ioutil.ReadFile(fname)
if err != nil {
log.Fatalln("Error reading file:", err)
}
book := &pb.AddressBook{}
if err := proto.Unmarshal(in, book); err != nil {
log.Fatalln("Failed to parse address book:", err)
}
Protocol Buffers
一段时间后,会释放使用protocol buffers
的代码,毫无疑问会想要“改进”protocol buffers
的定义。如果希望新缓冲区向后兼容,并且旧缓冲区是向前兼容的,那么需要在新得到protocol buffers
中遵循一些规则:
这些规则有一些例外,但它们很少使用。
如果遵循这些规则,旧代码将很乐意阅读新消息并简单地忽略任何新字段。对于旧代码,已删除的单个字段将只具有其默认值,删除的重复字段将为空。新代码也将透明地读取旧消息。
但是,请记住旧消息中不会出现新字段,因此需要使用默认值执行合理的操作。使用特定于类型的默认值: