3.3.其它语言中的Rust

作为我们的第三个项目,我们决定选择一些可以展示Rust最强实力的东西:缺少实质的运行时。

当组织增长,他们越来越依赖大量的编程语言。不同的编程语言有不同的能力和弱点,而一个多语言栈让你使用特定的语言当它的能力起作用,用另一个当它是有弱点的。

一个非常常见的问题是很多编程语言在程序的运行时性能是很差的。经常,使用一个更慢的,不过提供了更强大的程序猿生产力的语言是一个值得的权衡。为了帮助缓和这个问题,它们提供了一个用C编写部分你的系统,然后接着用高级语言编写的代码调用C代码。这叫做一个“外部语言接口”,通常简写为“FFI”。

Rust在所有两个方向支持FFI:它可以简单的调用C代码,而且至关重要的,他也可以简单的_在_C中被调用。与Rust缺乏垃圾回收和底层运行时要求相结合,这让Rust成为一个当你需要嵌入其它语言中以提供一些额外的活力时的强大的候选。

这有一个全面专注于FFI的章节和详情位于本书的其它位置。,不过在这一章,我们会检查这个特定的FFI的用例,通过3个例子,分别在Ruby,Python和JavaScript中。

问题

这里有很多不同的项目我们可以选择,不过我们将选择一个Rust相比其它语言有明确优势的例子:数值计算和线程。

很多语言,为了一致性,将数字放在堆上,而不是放在栈上。特别是在专注面向对象编程和使用垃圾回收的语言中,堆分配是默认行为。有时优化会栈分配特定的数字,不过与其依赖优化器做这个工作,我们可能想要确保我们总是使用原始类型而不是使用各种对象类型。

第二,很多语言有一个“全局翻译锁”,它在很多情况下限制了并发。这在安全的名义下被使用,也有一定的积极影响,不过它限制了同时可以进行的工作的数量,这是一个很负面的影响。

为了强调这两方面,我们将创建一个大量使用这两方面的项目。因为这个例子关注的是将Rust嵌入到其它语言中,而不是问题自身,我们只使用一个玩具例子:

启动10个线程。在每个线程中,从1数到500万。在所有10个线程结束后,打印“done”。

我选择500万基于我特定的电脑。这里是一个例子的Ruby代码:

threads = []

10.times do
  threads << Thread.new do
    count = 0

    5_000_000.times do
      count += 1
    end
  end
end

threads.each {|t| t.join }
puts "done!"

尝试运行这个例子,并选择一个将运行几秒钟的数字。基于你电脑的硬件配置,你可能需要增大或减小这个数字。

在我的系统中,运行这个例子花费2.156秒。并且,如果我用一些进程监视工具,像top,我可以看到它只用了我的机器的一个核。这是GIL在起作用。

虽然这确实是一个虚构的程序,你可以想象许多问题与现实世界中的问题相似。为了我们的目标,启动一些繁忙的线程来代表一些并行的,昂贵的计算。

一个Rust库

让我们用Rust重写这个问题。首先,让我们用Cargo创建一个新项目:

$ cargo new embed
$ cd embed

这个程序在Rust中很好写:

use std::thread;

fn process() {
    let handles: Vec<_> = (0..10).map(|_| {
        thread::spawn(|| {
            let mut _x = 0;
            for _ in (0..5_000_001) {
                _x += 1
            }
        })
    }).collect();

    for h in handles {
        h.join().ok().expect("Could not join a thread!");
    }
}

一些代码可能与前面的例子类似。我们启动了10个线程,把它们收集到一个handles向量中。在每一个线程里,我们循环500万次,并每次给_x加一。为什么用下划线呢?好吧,如果我们去掉它并编译:

$ cargo build
   Compiling embed v0.1.0 (file:///home/steve/src/embed)
src/lib.rs:3:1: 16:2 warning: function is never used: `process`, #[warn(dead_code)] on by default
src/lib.rs:3 fn process() {
src/lib.rs:4     let handles: Vec<_> = (0..10).map(|_| {
src/lib.rs:5         thread::spawn(|| {
src/lib.rs:6             let mut x = 0;
src/lib.rs:7             for _ in (0..5_000_001) {
src/lib.rs:8                 x += 1
             ...
src/lib.rs:6:17: 6:22 warning: variable `x` is assigned to, but never used, #[warn(unused_variables)] on by default
src/lib.rs:6             let mut x = 0;
                             ^~~~~

第一个警告是因为我们正在构建一个库。如果我们有一个函数的测试函数,就不会有警告了。不过目前它并不会被调用。

第二个与xVS_x相关。因为实际上我们从未对x_进行_任何处理,我们为此得到一个警告。在我们的情况中,这完全木有问题,因为我们只是想浪费CPU循环。对x使用下划线前缀将移除这个警告。

最后,我们同步每个线程。

然而现在,这是一个Rust库,而且它并没有暴露任何可以从C中调用的东西。如果现在我们尝试在别的语言中链接这个库,这并不能工作。我们只需做两个小的改变来修复这个问题,第一个是修改我们代码的开头:

#[no_mangle]
pub extern fn process() {

我们必须增加一个新的属性,no_mangle。当你创建了一个Rust库,它早编译输出中改变了函数的名称。这么做的原因超出了本教程的范围,不过为了其它语言能够知道如何调用这些函数,我们需要不这么做。这个属性将它关闭。

另一个变化是pub externpub意味着这个函数应当从模块外被调用,而extern说它应当能被C调用。这就是了!没有更多的修改。

我们需要做的第二件事是修改我们的Cargo.toml的一个设定。在底部加上这些:

[lib]
name = "embed"
crate-type = ["dylib"]

这告诉Rust我们想要将我们的库编译为一个标准的动态库。默认,Rust编译为一个“rlib”,一个Rust特定的格式。

现在让我们构建这个项目:

$ cargo build --release
   Compiling embed v0.1.0 (file:///home/steve/src/embed)

我们选择了cargo build --release,它打开了优化进行构建。我们想让它越快越好!你可以在target/release找到输出的库:

$ ls target/release/
build  deps  examples  libembed.so  native

那个libembed.so就是我们的“共享目标(动态)”库。我们可以像任何用C写的动态库使用这个文件!另外,这也可能有embed.dlllibembed.dylib,基于不同的平台。

现在我们构建了我们的Rust库,让我们在Ruby中使用它。

Ruby

在我们的项目中打开一个embed.rb文件。并这么做:

require "ffi"

module Hello
  extend FFI::Library
  ffi_lib "target/release/libembed.so"
  attach_function :process, [], :void
end

Hello.process

puts "done!”

在我们可以运行之前,我们需要安装ffigem:

$ gem install ffi # this may need sudo
Fetching: ffi-1.9.8.gem (100%)
Building native extensions.  This could take a while...
Successfully installed ffi-1.9.8
Parsing documentation for ffi-1.9.8
Installing ri documentation for ffi-1.9.8
Done installing documentation for ffi after 0 seconds
1 gem installed

最后,我们可以尝试运行它:

$ ruby embed.rb
done!
$

哇哦,这很快欸!在我系统中,它花费了0.086秒,而不是纯Ruby所需的2秒。让我们分开我们的Ruby代码:

require "ffi"

首先我们需要ffigem。这让我们可以像C库一样使用Rust的接口。

module Hello
  extend FFI::Library
  ffi_lib "target/release/libembed.so"

ffigem的作者建议使用一个模块来限制我们从共享库导入的函数的作用域。在其中,我们extend必要的FFI::Library模块,接着调用ffi_lib加载我们的动态库。我们仅仅传递我们库存储的路径,它是我们之前见过的,是target/release/libembed.so

attach_function :process, [], :void

attach_function方法由ffigem提供。它用来把我们Rust中process()连接到Ruby中同名函数。因为process()没有参数,第二个参数是一个空数组,并且因为它没有返回值。我传递:void作为最后的参数。

Hello.process

这是实际的Rust调用。我们的moduleattach_function调用的组合设置了环境。它看起来像一个Ruby函数,不过它实际是Rust!

puts "done!"

最后,作为我们每个项目的要求,我们打印done!

这就是全部!就像我们看到的,连接两个语言真是很简单,并为我们带来了很多性提升。

接下来,让我们试试Python!

Python

在这个目录中创建一个embed.py,并写入这些:

from ctypes import cdll
lib = cdll.LoadLibrary("target/release/libembed.so")
lib.process()
print("done!")

甚至更简单了!我们使用ctypes模块的cdll。之后是一个快速的LoadLibrary,然后我可以调用process()

在我的系统,这花费了0.017秒。灰常快!

Node.js

Node并不是一个语言,不过目前它是服务端JavaScript的居统治地位的实现。

为了在Nod中进行FFI,首先我们需要安装这个库:

$ npm install ffi

安装之后,我们就可以使用它了:

var ffi = require("ffi");

var lib = ffi.Library("target/release/libembed", {
  "process": [ "void", []  ]
});

lib.process();

console.log("done!");

这看起来比Python的例子更像Ruby的例子。我们使用ffi模块来获取ffi.Library(),它加载我们的动态库。我们需要标明函数的返回值和参数值,它们是返回“void”,和一个空数组表明没有参数。这样,我们就可以调用它并打印结果。

在我的系统上,这会花费0.092秒,很快。

结论

如你所见,基础操作是_很_简单的。当然,这里有很多我们可以做的。查看FFI章节以了解跟多细节。

文章导航