1
++++++++++[>+++++++>++++++++++>+++>+<<<<-]>++.>+.+++++++..+++.>++.<<+++++++++++++++.>.+++.------.--------.>+.>.

上面这段 BrainFuck 代码输出结果是 Hello World! 。是不是第一次看到这样的代码的时候一脸懵〇。

原语

BrainFuck 是一种故意刁难程序员的图灵完备语言。语言的执行类似栈的出栈入栈,搭配一个指向栈顶的指针,进行相应的输出输入等操作。整个语言只有 8 个原语

原语 操作 类比C语言
> 指针 + 1 ++ptr
< 指针 - 1 –ptr
+ 指针指向的数据 + 1 ++*ptr
- 指针指向的数据 - 1 –*ptr
. 输出指针指向的数据 putChar(*ptr)
, 接受数据输入,存在指针所指向的位置 *ptr = getChar()
[ 循环开始,数据为零则结束循环 while(*ptr){
] 循环结束 }

BrainFuck 只接受这 8 个字符,其他字符全部忽略。所以注释可以直接写,只要注释中没有原语。

简单的程序

BrainFuck 中所有数据都初始化为 0 ,模型看起来像是这样的

1
(0) 0 0 0 0 0 0 0 0 ... ()用于表示当前指针的位置

输出以 ASCII 编码输出。输出后数据不会清零。

ASCII 中第一个可见字符是 ! ,ASCII 码为 33 。所以只要用 + 加 33 次就可以从 0 变成 33 了。之后输出即可。

1
2
+++++++++++++++++++++++++++++++++.
输出 !

直接写 33 个 + 似乎有点蠢。既然做的事是重复的事情,用循环是最自然的。

$33 = 3 \times 11$ 。循环 3 次,每次加 11 就可以了。

1
2
3
4
5
6
7
8
9
10
+++ (3) 0 0 0 0 0 …… 写入循环次数
[ 循环开始
> 3 (0) 0 0 0 0 ……
+++++++++++ 3 (11) 0 0 0 0 ……
< (3) 11 0 0 0 0 ……
- (2) 11 0 0 0 0 ……
] 当前数据不为 0 则跳转到循环开始部分
当循环结束后是这样 (0) 33 0 0 0 0 ……
> 0 (33) 0 0 0 0 ……
. ASCII 编码输出

完整的代码

1
+++[>+++++++++++<-]>.

22 个字符,比原来 34 个字符少了 12 个字符。

Hello World!

Hello World! 的输出方式也是类似的。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
++++++++++ (10) 0 0 0 0 0 ……
[
> 10 (0) 0 0 0 0 ……
+++++++ 10 (7) 0 0 0 0 ……
> 10 7 (0) 0 0 0 ……
++++++++++ 10 7 (10) 0 0 0 ……
> 10 7 10 (0) 0 0 ……
+++ 10 7 10 (3) 0 0 ……
> 10 7 10 3 (0) 0 ……
+ 10 7 10 3 (1) 0 ……
<<<< (10) 7 10 3 1 0 ……
- (9) 7 10 3 1 0 ……
] 循环结束后 (0) 7*10 10*10 3*10 1*10 0 …… 也就是 (0) 70 100 30 10 0 ……
> 0 (70) 100 30 10 0 ……
++ 0 (72) 100 30 10 0 ……
. 输出 ASCII 72 也就是 H
> 0 72 (100) 30 10 0 ……
+ 0 72 (101) 30 10 0 ……
. 输出 ASCII 101 也就是 e
+++++++ 0 72 (108) 30 10 0 ……
. 输出 ASCII 108 也就是 l
. 输出 ASCII 108 也就是 l
+++ 0 72 (111) 30 10 0 ……
. 输出 ASCII 111 也就是 o
> 0 72 111 (30) 10 0 ……
++ 0 72 111 (32) 10 0 ……
. 输出 ASCII 32 也就是 空格
<< 0 (72) 111 32 10 0 ……
+++++++++++++++ 0 (87) 111 32 10 0 ……
. 输出 ASCII 87 也就是 W
> 0 87 (111) 32 10 0 ……
. 输出 ASCII 111 也就是 o
+++ 0 87 (114) 32 10 0 ……
. 输出 ASCII 114 也就是 r
------ 0 87 (108) 32 10 0 ……
. 输出 ASCII 108 也就是 l
-------- 0 87 (100) 32 10 0 ……
. 输出 ASCII 100 也就是 d
> 0 87 100 (32) 10 0 ……
+ 0 87 100 (33) 10 0 ……
. 输出 ASCII 33 也就是 !
> 0 87 100 33 (10) 0 ……
. 输出 ASCII 10 也就是 换行

也不是很难嘛。只不过把实现的思想隐藏到了代码中。

最后

1
++++++++++[>++++>+++++++++++>+++<<<-]>+++.++++++.>+++++.>+++.