Go 博客
第一个 Go 程序
我和 Brad Fitzpatrick (Andrew Gerrand) 最近开始重构 godoc,我突然想到它是最古老的 Go 程序之一。Robert Griesemer 早在 2009 年初就开始编写它,我们今天仍在使用它。
当我发推文谈论此事时,Dave Cheney 回复了一个有趣的问题:最古老的 Go 程序是什么?Rob Pike 翻阅了他的邮件,在一条发给 Robert 和 Ken Thompson 的旧消息中找到了它。
以下是第一个 Go 程序。它由 Rob 在 2008 年 2 月编写,当时团队只有 Rob、Robert 和 Ken。他们有一个明确的功能列表(在这篇博客文章中提到)和一个粗略的语言规范。Ken 刚刚完成了 Go 编译器的第一个工作版本(它不生成原生代码,而是将 Go 代码转换为 C 以进行快速原型开发),于是时候尝试用它编写程序了。
Rob 向“Go 团队”发送了邮件
From: Rob 'Commander' Pike
Date: Wed, Feb 6, 2008 at 3:42 PM
To: Ken Thompson, Robert Griesemer
Subject: slist
it works now.
roro=% a.out
(defn foo (add 12 34))
return: icounter = 4440
roro=%
here's the code.
some ugly hackery to get around the lack of strings.
(程序输出中的 icounter
行是执行的语句数量,用于调试打印。)
package main // fake stuff type char uint8; // const char TESTSTRING[] = "(defn foo (add 'a 'b))\n"; type Atom struct { string *[100]char; integer int; next *Slist; /* in hash bucket */ } type List struct { car *Slist; cdr *Slist; } type Slist struct { isatom bool; isstring bool; //union { atom Atom; list List; //} u; Free method(); Print method(); PrintOne method(doparen bool); String method(*char <-); Integer method(int <-); Car method(*Slist <-); Cdr method(*Slist <-); } method (this *Slist) Car(*Slist <-) { return this.list.car; } method (this *Slist) Cdr(*Slist <-) { return this.list.cdr; } method (this *Slist) String(*[100]char <-) { return this.atom.string; } method (this *Slist) Integer(int <-) { return this.atom.integer; } function OpenFile(); function Parse(*Slist <-); //Slist* atom(char *s, int i); var token int; var peekc int = -1; var lineno int32 = 1; var input [100*1000]char; var inputindex int = 0; var tokenbuf [100]char; var EOF int = -1; // BUG should be const function main(int32 <-) { var list *Slist; OpenFile(); for ;; { list = Parse(); if list == nil { break; } list.Print(); list.Free(); break; } return 0; } method (slist *Slist) Free(<-) { if slist == nil { return; } if slist.isatom { // free(slist.String()); } else { slist.Car().Free(); slist.Cdr().Free(); } // free(slist); } method (slist *Slist) PrintOne(<- doparen bool) { if slist == nil { return; } if slist.isatom { if slist.isstring { print(slist.String()); } else { print(slist.Integer()); } } else { if doparen { print("("); } slist.Car().PrintOne(true); if slist.Cdr() != nil { print(" "); slist.Cdr().PrintOne(false); } if doparen { print(")"); } } } method (slist *Slist) Print() { slist.PrintOne(true); print "\n"; } function Get(int <-) { var c int; if peekc >= 0 { c = peekc; peekc = -1; } else { c = convert(int, input[inputindex]); inputindex = inputindex + 1; // BUG should be incr one expr if c == '\n' { lineno = lineno + 1; } if c == '\0' { inputindex = inputindex - 1; c = EOF; } } return c; } function WhiteSpace(bool <- c int) { return c == ' ' || c == '\t' || c == '\r' || c == '\n'; } function NextToken() { var i, c int; var backslash bool; tokenbuf[0] = '\0'; // clear previous token c = Get(); while WhiteSpace(c) { c = Get(); } switch c { case EOF: token = EOF; case '(': case ')': token = c; break; case: for i = 0; i < 100 - 1; { // sizeof tokenbuf - 1 tokenbuf[i] = convert(char, c); i = i + 1; c = Get(); if c == EOF { break; } if WhiteSpace(c) || c == ')' { peekc = c; break; } } if i >= 100 - 1 { // sizeof tokenbuf - 1 panic "atom too long\n"; } tokenbuf[i] = '\0'; if '0' <= tokenbuf[0] && tokenbuf[0] <= '9' { token = '0'; } else { token = 'A'; } } } function Expect(<- c int) { if token != c { print "parse error: expected ", c, "\n"; panic "parse"; } NextToken(); } // Parse a non-parenthesized list up to a closing paren or EOF function ParseList(*Slist <-) { var slist, retval *Slist; slist = new(Slist); slist.list.car = nil; slist.list.cdr = nil; slist.isatom = false; slist.isstring = false; retval = slist; for ;; { slist.list.car = Parse(); if token == ')' { // empty cdr break; } if token == EOF { // empty cdr BUG SHOULD USE || break; } slist.list.cdr = new(Slist); slist = slist.list.cdr; } return retval; } function atom(*Slist <- i int) { // BUG: uses tokenbuf; should take argument var h, length int; var slist, tail *Slist; slist = new(Slist); if token == '0' { slist.atom.integer = i; slist.isstring = false; } else { slist.atom.string = new([100]char); var i int; for i = 0; ; i = i + 1 { (*slist.atom.string)[i] = tokenbuf[i]; if tokenbuf[i] == '\0' { break; } } //slist.atom.string = "hello"; // BUG! s; //= strdup(s); slist.isstring = true; } slist.isatom = true; return slist; } function atoi(int <-) { // BUG: uses tokenbuf; should take argument var v int = 0; for i := 0; '0' <= tokenbuf[i] && tokenbuf[i] <= '9'; i = i + 1 { v = 10 * v + convert(int, tokenbuf[i] - '0'); } return v; } function Parse(*Slist <-) { var slist *Slist; if token == EOF || token == ')' { return nil; } if token == '(' { NextToken(); slist = ParseList(); Expect(')'); return slist; } else { // Atom switch token { case EOF: return nil; case '0': slist = atom(atoi()); case '"': case 'A': slist = atom(0); case: slist = nil; print "unknown token"; //, token, tokenbuf; } NextToken(); return slist; } return nil; } function OpenFile() { //strcpy(input, TESTSTRING); //inputindex = 0; // (defn foo (add 12 34))\n inputindex = 0; peekc = -1; // BUG EOF = -1; // BUG i := 0; input[i] = '('; i = i + 1; input[i] = 'd'; i = i + 1; input[i] = 'e'; i = i + 1; input[i] = 'f'; i = i + 1; input[i] = 'n'; i = i + 1; input[i] = ' '; i = i + 1; input[i] = 'f'; i = i + 1; input[i] = 'o'; i = i + 1; input[i] = 'o'; i = i + 1; input[i] = ' '; i = i + 1; input[i] = '('; i = i + 1; input[i] = 'a'; i = i + 1; input[i] = 'd'; i = i + 1; input[i] = 'd'; i = i + 1; input[i] = ' '; i = i + 1; input[i] = '1'; i = i + 1; input[i] = '2'; i = i + 1; input[i] = ' '; i = i + 1; input[i] = '3'; i = i + 1; input[i] = '4'; i = i + 1; input[i] = ')'; i = i + 1; input[i] = ')'; i = i + 1; input[i] = '\n'; i = i + 1; NextToken(); }
该程序解析并打印一个S-表达式。它不接受用户输入,也没有导入,仅依赖内置的 print
功能进行输出。它是在 一个可工作但粗糙的编译器 诞生的第一天就编写的。当时语言的大部分功能尚未实现,有些甚至还没有被指定。
尽管如此,当今语言的基本风格仍可以在此程序中识别出来。类型和变量声明、控制流以及包语句变化不大。
但存在许多差异和缺失。最显著的是缺乏并发和接口——这两者自第一天起就被认为是必不可少的,但当时尚未设计。
func
曾是 function
,其签名规定了返回值在参数之前,用 <-
分隔,我们现在将 <-
用作通道发送/接收操作符。例如,WhiteSpace
函数接受整数 c
并返回布尔值。
function WhiteSpace(bool <- c int)
这个箭头是暂时的措施,直到出现了更好的语法来声明多个返回值。
方法与函数不同,并有自己的关键字。
method (this *Slist) Car(*Slist <-) {
return this.list.car;
}
方法在结构体定义中预先声明,尽管这很快就改变了。
type Slist struct {
...
Car method(*Slist <-);
}
当时没有字符串,尽管它们在规范中。为了解决这个问题,Rob 不得不使用笨拙的构造方式将输入字符串构建为 uint8
数组。(数组是基本的,切片当时尚未设计,更不用说实现了,尽管存在一个未实现的“开放数组”概念。)
input[i] = '('; i = i + 1;
input[i] = 'd'; i = i + 1;
input[i] = 'e'; i = i + 1;
input[i] = 'f'; i = i + 1;
input[i] = 'n'; i = i + 1;
input[i] = ' '; i = i + 1;
...
panic
和 print
都是内置关键字,而不是预声明函数。
print "parse error: expected ", c, "\n";
panic "parse";
还有许多其他细微的差异;看看您能否找出一些别的。
在该程序编写不到两年后,Go 作为开源项目发布了。回首过去,该语言的发展和成熟程度令人惊叹。(这个原型 Go 和我们今天所知的 Go 之间最后改变的一点是取消了分号。)
但更令人惊叹的是我们对 Go 代码的编写学到了多少。例如,Rob 称他的方法接收者为 this
,但现在我们使用更短的、特定于上下文的名称。还有数百个更重要的例子,直到今天,我们仍在不断发现更好的编写 Go 代码的方法。(查看 glog 包在处理详细程度级别方面的巧妙技巧。)
我想知道明天我们会学到什么。
下一篇文章:数组、切片(和字符串):“append”的机制
上一篇文章:Go竞态检测器简介
博客索引