2025-11-17 19:12:22 +07:00

35 KiB
Raw Permalink Blame History

ОР - Умеет собирать статические и динамические библиотеки из Rust кода, и экспортировать функции из них. А также проверять экспортируемые символы с помощью системных утилит (например, nm).
ОР - Умеет описывать Си ABI в Rust коде. (с точки зрения best practice)
ОР - Умеет линковать Си библиотеки к Rust коду (статически, динамически и в рантайме - все три варианта)
ОР - Понимает, как использовать Rust библиотеку в других языках (например, в python) и понимает, для чего это может быть полезно.
ОР - Умеет использовать bindgen и cc для генерации Rust API из Си header файлов и сборки Си библиотеки (https://github.com/DaveGamble/cJSON).

  • Умеет собирать статические и динамические библиотеки из Rust кода, и экспортировать функции из них. А также проверять экспортируемые символы с помощью системных утилит (например, nm).

  • Умеет описывать Си ABI в Rust коде. (с точки зрения best practice)

  • Умеет линковать Си библиотеки к Rust коду (статически, динамически и в рантайме - все три варианта)

  • Понимает, как использовать Rust библиотеку в других языках (например, в python) и понимает, для чего это может быть полезно.

  • Умеет использовать bindgen и cc для генерации Rust API из Си header файлов и сборки Си библиотеки (https://github.com/DaveGamble/cJSON).

    • Умеет импользовать bindgen и cc для генерации Rust API из Си header файлов
    • Практика: сборка Си библиотеки (https://github.com/DaveGamble/cJSON).
  • Прописать ОРы для глав 2025-11-17

  • Придумать квизы 2025-11-17

старт

  • Сначала практически расписать бест практис с с аби,
  • потом рассказать про биндген
  • потом сс
  • потом линковка
  • ??а если мы захотим уже раст использовать как бблиотеку в другом языке?
  • рассказать низкоуровнево как прописывать экспорт раст кода
  • (упомянуть про как посмотреть экспорт)
  • в том числе и про разные способы линковки
  • потом показать на примере линковки к питону
  • потом рассказать про бест практис (возможно решив какую-нибудь проблему в предыдущей главе)

C ABI Best practice

  • Рассказать немного про бест практис, протом перейти к bindgen
  • best practice:
  • use std::ffi types
  • use *-sys
  • Добавление поля links в Cargo.toml крейта *-sys
  • use bindgen
  • генерация с build.rs (build dependencies)
  • Option nonnull for c abi (null optimization) ?cstr

Линковка

Рассказать про то, как низкоуровнево линкуется при помощи rustc, потом рассказать про то, как линковать с build.rs и потом cc

Start

В прошлом уроке вы узнали, как описывается C ABI в Rust. Давайте теперь посмотрим, как используется C ABI в production коде. Для этого изучим best practice использования C ABI.

Правильное использование C ABI

ОР - Умеет описывать Си ABI в Rust коде. (с точки зрения best practice)

Совместимость начинается со стандартов

Допустим, у нас есть такая волшебная функция на С:

int square(int x) {
	return x * x;
}

Как описать эту функцию в Rust? Возможно так?

unsafe extern "C" {
	fn square(x: i32) -> i32;
}

Но тут возникает проблема: в rust явно указана размерность в 32 бита, в то время как в C, int может быть не только размером 32 бита (к примеру у avr, той самой, которая используется в Arduino, размер int 16 бит). Для таких исключений есть модуль core::ffi (который реэкспортирован как std::ffi, так что его можно встретить с импортом по этому пути, но рекомендуется использовать именно по пути core от для поддержки {{no_std}}[https://docs.rust-embedded.org/book/intro/no-std.html] среды). И для описания функций рекомендуется использовать именно эти типы, так как в rust может добавиться поддержка новой архитектуры, со своими типами из C, и программа может незаметно стать памяти-небезопасной. Перепишем функцию:

use core::ffi::c_int;

unsafe extern "C" {
	fn square(x: c_int) -> c_int;
}

Заметка (extern без unsafe): (может быть под тогл/скрываемый блок?) Если читать код библиотек, можно встретить, что extern пишется без unsafe (взаимодействие и смысл этого ключевого слова вы изучите в следующем уроке). Так можно было делать раньше, но в rust это стало обязательным с версии 1.85. Идея заключается в том, что пишущий код человек может задекларировать функцию неправильно, и это обязанность программиста, а не компилятора соблюсти здесь безопасность по памяти (пример такой ситуации вы только что разобрали).

Optional pointer (null optimization) - нужно ли?

Отделение взаимодействия с ffi в отдельный крейт

Если вы пишете библиотеку, взаимодействующую с C ABI, отделяйте это взаимодействие в отдельный крейт (который обычно называют *-sys). На это есть несколько веских {{причин}}[https://doc.rust-lang.org/cargo/reference/build-scripts.html#-sys-packages]:

  • Несколько разных библиотек могут переиспользовать уже написанный код для взаимод
  • ействия с библиотекой
  • Так, одна и та же библиотека не будет собираться несколько раз и не будет слинкована несколько раз (то есть не будет существовать несколько разных или одинаковых версий библиотеки в бинаре)
  • Легкость изменения библиотеки, от которой зависит бинарь (версии, поиска ее пути и всей остальной конфигурации)

Квиз - множественный выбор Зачем отделять FFI-взаимодействие в отдельный *-sys крейт?

Чтобы ускорить выполнение сборки программы с нуля. Нет. Это не ускорит сборку конченой программы. Но, будет полезно, если разрабатываете библиотеку, ведь при каждом изменении не будет выполнятся build скрипт с линковкой.

Чтобы ускорить выполнение программы во время рантайма. Нет, отделение логики не ускорит программу.

Чтобы переиспользовать взаимодействие с библиотекой.
Правильно, при отделении логики в -sys крейт, ее смогут переиспользовать другие крейты. Так же, как и при отделении логики в фукнцию, которую можно использовать в другом месте кода

Чтобы не собирать статическую библиотеку несколько раз. Правильно, при переиспользовании -sys крейта статические библиотеки, которые собираются из исходного кода, будут собраны и включены в бинарь только один раз, вместо сборки в каждом использующем библиотеку крейте

Чтобы было проще обновлять или перенастраивать зависимую C-библиотеку (версия, путь, параметры сборки). Правильно, программист сможет изменить используемую библиотеку через аттрибут {{target.<triple>.<links>}}[https://doc.rust-lang.org/cargo/reference/config.html#targettriplelinks] в файле настроек cargo (./cargo/config.toml)

Чтобы избежать необходимости писать unsafe-код в основном проекте. Нет. Хоть и часть unsafe логики отделяется в этот крейт (а именно декларация функций), взаимодействие с этими функциями все еще будет не безопасным

При написании крейта, который линкуется с одной библиотекой, используйте {{links}}[https://doc.rust-lang.org/cargo/reference/build-scripts.html#the-links-manifest-key] в манифесте Cargo.toml, для указания, с какой библиотекой происходит линковка:

# Cargo.toml
[package]
links = "mylib"

Благодаря этому, программисты, в коде которых будет использоваться такой крейт, смогут {{перезаписать использование build скрипта}}[https://doc.rust-lang.org/cargo/reference/build-scripts.html#overriding-build-scripts], благодаря чему мы и получим третий плюс из предыдущего пункта

Автоматическая генерация extern внешних функций

ОР - Умеет использовать bindgen и cc для генерации Rust API из Си header файлов и сборки Си библиотеки (https://github.com/DaveGamble/cJSON). С обновлением версий библиотек, меняется и их интерфейс. К примеру, могут добавиться новые функции. Но поддерживать актуальные декларации внешних функций (так называемые {{байндинги}}[на английском термин binding, исходит от to bind, который переводится как связывать. говорит компилятору языка, что у нас существует такая функция, а линкеру объясняет, с какой функцией надо связывать]) вручную весьма трудозатратная задача (как и в принципе изначальное написание таких байндингов вручную). На помощь приходит автоматическая генерация при помощи крейта {{bindgen}}[https://github.com/rust-lang/rust-bindgen]. Одним из вариантов использования bindgen является его cli. Установите его:

cargo install bindgen-cli

Создайте новый проект, запишите следующее в файлы:

// src/main.rs
include!("./bindgen.rs");

fn main() {
    println!("Squared eleven: {}", unsafe { square(11) });
}
// src/mylib.c
int square(int x) {
    return x * x;
}
// src/mylib.h
int square(int x);

теперь используем bindgen для генерации байндингов:

bindgen src/mylib.h -o src/bindgen.rs

можете посмотреть в файл src/bindgen.rs, и увидеть там аналогичную декларацию функции, что вы писали, но сгенерированную автоматически :) Теперь соберем C библиотеку:

clang -c src/mylib.c -o mylib.o

Вместо clang можно использовать и gcc (и, теоретически, любой другой C компилятор), но так как rust зависит от инфраструктуры llvm, все примеры будут именно для clang И соберем и запустим программу:

RUSTFLAGS="-L. -l./mylib.o" cargo run

Переменная среды RUSTFLAGS позволяет добавить флаги, которые будут переданы rustc. В данном случае переданы флаги, которые говорят включить в сборку вашу библиотеку. То, как обычно это делается (через скрипт сборки и через cc) будет разобрано чуть позже в этом уроке.

Ваша программа успешно запустилась и выдала ожидаемый результат:

Squared eleven: 121

Автоматизация сборки

ОР - Умеет линковать Си библиотеки к Rust коду (статически, динамически и в рантайме - все три варианта)
Для того, чтобы не делать все это вручную, в cargo есть возможность написать свой скрипт сборщика, который выполнит нужные нам действия перед компиляцией и передаст cargo инструкции для компиляции кода. Обычно такой код расположен в файле build.rs (но путь к нему можно изменить через атрибут {{build}}[https://doc.rust-lang.org/cargo/reference/manifest.html#the-build-field] в Cargo.toml). Давайте сделаем то же самое, но используя build.rs. Для начала, подчистим выхлоп предыдущего эксперимента:

rm src/bindgen.rs # но пока оставим mylib.o

Теперь напишем build.rs (в корне проекта):

// build.rs
use bindgen;
use std::{env, path::PathBuf};

fn main() {
    let bindings = bindgen::builder()
        // Файл, для которого создаются байндинги
        .header("src/mylib.h")
        // Перезапуск сборки при изменении переданных файлов
        .parse_callbacks(Box::new(bindgen::CargoCallbacks::new()))
        // Сгенерировать байндинги
        .generate()
        .expect("Unable to generate bindings");

    let out_path = PathBuf::from(env::var("OUT_DIR").unwrap());
    bindings
        // Записать получившиеся байндинги в файл OUT_DIR/bindgen.rs
        .write_to_file(out_path.join("bindgen.rs"))
        .expect("Couldn't write bindings!");

    // Передать линкеру, что библиотеки нужно искать в нынешней папке
    // Аналогичен флагу -L.
    // Информация в cargo передается через stdout
    println!("cargo::rustc-link-search=.");
    // Передать линкеру, что нужно слинковать с библиотекой ./mylib.o
    // Аналогичен флагу -l./mylib.o
    println!("cargo::rustc-link-lib=./mylib.o");
}

Как вы тут заметили, вместо вызова cli тут используется вызов крейта bindgen. Это рекомендуемый способ использования bindgen, и cli на практике используется редко. Чтобы иметь возможность использовать его в сборочном скрипте, добавьте его в зависимости для сборки:

cargo add bindgen --build

Так же, вместо выхлопа bindgen.rs в папку src/ выходной файл будет находиться внутри папки {{OUT_DIR}}[https://doc.rust-lang.org/cargo/reference/environment-variables.html#:~:text=.exe.-,OUT_DIR,-%E2%80%94%20If%20the%20package]. Это именно та папка, куда build.rs должен ложить все свои выходные файлы. Ни в коем случае не надо ложить файлы в src! Так как выходные файлы не являются сами по себе частью проекта, и являются промежуточным результатом компиляции, то и находится они должны в одной из подпапок target, а именно в OUT_DIR. Так как путь к bindgen.rs изменился, замените предыдущий include! в src/main.rs на такой:

include!(concat!(env!("OUT_DIR"), "/bindgen.rs"));

Попробуем запустить все это:

cargo run

Байндинги автоматически были созданы и линковка тоже произошла, осталось добавить сборку C кода в библиотеку.

Сброка C кода в Rust

ОР - Умеет использовать bindgen и cc для генерации Rust API из Си header файлов и сборки Си библиотеки (https://github.com/DaveGamble/cJSON). Так же, как и для генерации байндингов существует bindgen, для компиляции библиотек существует крейтcc. Фактически, он под капотом вызывает компилятор C со всеми задаными флагами. Добавим его в зависимости для сборки:

cargo add cc --build

И обновим build.rs:

// build.rs
use bindgen;
use cc;
use std::{env, path::PathBuf};

fn main() {
    let bindings = bindgen::builder()
        // Файл, для которого создаются байндинги
        .header("src/mylib.h")
        // Перезапуск сборки при изменении переданных файлов
        .parse_callbacks(Box::new(bindgen::CargoCallbacks::new()))
        // Сгенерировать байндинги
        .generate()
        .expect("Unable to generate bindings");

    let out_path = PathBuf::from(env::var("OUT_DIR").unwrap());
    bindings
        // Записать получившиеся байндинги в файл OUT_DIR/bindgen.rs
        .write_to_file(out_path.join("bindgen.rs"))
        .expect("Couldn't write bindings!");

    cc::Build::new()
        // добавить src/mylib.c в выходную библиотеку
        .file("src/mylib.c")
        // скомпилировать C код как библиотеку libmylib.a в папке OUT_DIR 
        .compile("mylib");
}

Заметьте, что пропало явное обозначение, что нужно слинковать с библиотекой. cc сам передаст cargo название библиотеки, с которой нужно слинковать. Перед запуском, для чистоты эксперимента, удалите старый файл:

rm mylib.o

Теперь сборку и запуск можно делать просто через cargo run, не выполняя лишних команд.

Линковка с динамической библиотекой

До этого мы собирали только со статической библиотекой. Теперь, давайте слинкуем с динамической библиотекой. Для этого, сначала соберем ее:

clang src/mylib.c -shared -o libmylib.so

А теперь, в build.rs уберите использование cc и добавьте в конце функции main:

fn main() {
	// Генерация байндингов
	// ...
	
    println!("cargo:rustc-link-search=.");
    println!("cargo:rustc-link-lib=dylib=mylib");
}

В cargo:rustc-link-lib передано значение dylib=mylib. Оно позволяет явно указать, что нужно подгрузить динамическую библиотеку (dylib) с название mylib (у такой библиотеки будет название libmylib.so на примере linux). Значение [тип=] опционально и может быть одним из:

  • dylib - динамическая библиотека
  • static - статическая библиотека
  • framework - специфичный формат для MacOS, содержащий динамичекую библиотеку с дополнительными ресурсами cc не поддерживает генерацию динамических библиотек, так как она не будет являться частью создаваемого cargo и rustc бинаря. Динамические библиотеки обычно являются частью системы (те же libc, zlib, openssl, присутствие которых бинари будут ожидать по стандартным путям). Установлены они могут быть, к примеру, через apt, pacman, установщики windows, и так далее. Либо создаются отдельно и поставляются с программой.

Линковка в рантайме

ОР - Умеет линковать Си библиотеки к Rust коду (статически, динамически и в рантайме - все три варианта)
Последний способ линковки в рантайме, позволяет не тратить лишний раз оперативную память, загружая код лишь только тогда, когда он нужен. Для независимости от платформы будем использовать dlopen и dlsym.

  • dlopen - подгружает нужную нам библиотеку
  • dlsym - ищет в библиотеке нужный символ и выдает его адрес, и это может быть не только функция, но и, к примеру, константа, статическая переменая, и тд. Для начала, удалите build.rs. Добавьте libc как зависимость. Напишите в src/main.rs:
// src/main.rs
use libc::{dlopen, dlsym};
use std::ffi::c_int;

fn main() {
    let mylib = unsafe { dlopen(c"./libmylib.so".as_ptr(), 0) };
    let square: extern "C" fn(c_int) -> c_int =
        unsafe { std::mem::transmute(dlsym(mylib, c"square".as_ptr())) };
    println!("Squared eleven: {}", unsafe { square(11) });
}

Запустив это, получите ровно тот же результат, что и раньше, но теперь библиотеку мы подгружаем сами. Кстати, линкер для динамических библиотек делает то же самое, но подгружает библиотеки еще до вызова main, а адреса функций кладет в заранее заготовленную таблицу функций.

Практика

Создайте новый проект, с таким содержимым в src/main.rs:

include!(concat!(env!("OUT_DIR"), "/bindgen.rs"));

use std::ffi::{CStr, CString};

const TEST_JSON: &CStr = c"{
    \"meaning_of_life\": 42
}";

fn main() {
    let json: *mut cJSON = unsafe { cJSON_Parse(TEST_JSON.as_ptr()) };

    let json_str = unsafe { cJSON_PrintUnformatted(json) };
    let json_str = unsafe { CString::from_raw(json_str) };
    let json_str = json_str.to_str().unwrap();
    assert_eq!(json_str, r#"{"meaning_of_life":42}"#);

    let meaning_of_life = unsafe { cJSON_GetObjectItem(json, c"meaning_of_life".as_ptr()) };
    let meaning_of_life = unsafe { cJSON_GetNumberValue(meaning_of_life) };
    println!("Meaning of life: {}", meaning_of_life);
    assert_eq!(meaning_of_life, 42f64);
}

Создайте такой build.rs, чтобы этот код заработал. Используйте библиотеку cJSON, ее можно склонировать прямо в корень проекта. Подсказки: Экспорт функций можно сгенерировать от cJSON.h используя bindgen Чтобы была возможность использовать код из cJSON, соберите библиотеку через cc Байндинги записываются в bindgen.rs в папке, указанной в переменной среды OUT_DIR Чек-лист: Линкуется cJSON как статическая библиотека Файл bindgen.rs с байндингами находится в папке, указанной в переменной среды OUT_DIR Тесты проходят Решение:

use bindgen;
use cc;
use std::{env, path::PathBuf};

fn main() {
    let bindings = bindgen::builder()
        .header("cJSON/cJSON.h")
        .generate()
        .expect("Unable to generate bindings");

    let out_path = PathBuf::from(env::var("OUT_DIR").unwrap());
    bindings
        .write_to_file(out_path.join("bindgen.rs"))
        .expect("Couldn't write bindings!");

    cc::Build::new()
        // добавить src/mylib.c в выходную библиотеку
        .file("cJSON/cJSON.c")
        // скомпилировать C код как библиотеку libmylib.a в папке OUT_DIR
        .compile("cJSON");
}

Rust как библиотека

ОР - Умеет собирать статические и динамические библиотеки из Rust кода, и экспортировать функции из них. А также проверять экспортируемые символы с помощью системных утилит (например, nm).
ОР - Понимает, как использовать Rust библиотеку в других языках (например, в python) и понимает, для чего это может быть полезно.
В течении всего урока мы использовали C код из Rust кода. А что если нужно будет использовать rust код из других языков, к примеру, того же C, Go, или Python? И это тоже возможно, через тот же C ABI, но на экспорт. Такая функция декларируется так:

#[unsafe(no_mangle)]
pub extern "C" fn doublefast(x: u32) -> u32 {
    x << 1
}
  • no_mangle - говорит rust, что название функции не надо преобразовывать
  • extern "C" - использовать C ABI
  • pub extern - экспорт функции Создайте новый проект как библиотеку:
cargo new --lib mylib

В Cargo.toml добавьте:

[lib]
crate-type = ["cdylib"] # cdylib означает, что нужно собрать динамическую библиотеку

А в src/lib.rs внесите показанный ранее код:

#[unsafe(no_mangle)]
pub extern "C" fn doublefast(x: u32) -> u32 {
    x << 1
}

Соберите библиотеку. Выходным файлом получится target/debug/libmylib.so (В зависимости от вашей ОС расширение .so, используемое в linux, может замениться на .dylib в macos или .dll в windows). Можем проверить наличие символа в библиотеке для функции через nm из пакета binutils:

# nm выведет весь список символов
# grep покажет только doublefast, если он есть
nm target/debug/libmylib.so | grep doublefast

Попробуем использовать нашу функцию, к примеру, такой код в Python:

from ctypes import cdll
mylib = cdll.LoadLibrary("target/debug/libmylib.dylib")
print(mylib.doublefast(8))

Успешно выведет 16 Информация о том, какие типы функция принимает и выдает не сохраняется в библиотеке, просто по дефолту python считает, что функция принимает и выдает i32 Такое применение имеет практическую пользу: аналогичный код на rust выполняется в разы быстрее, чем код на python, поэтому много библиотек для python пишутся на C, а со становления rust популяным многие уже пишутся на rust.

Сборка статической библиотеки

Что собрать то же самое, но в статическую библиотеку, нужно в crate-type изменить cdylib на staticlib (либо можно оставить и то и то, тогда будут собираться обе версии библиотеки):

[lib]
crate-type = ["staticlib"]
# или можно сделать такой вариант, тогда соберется
# два файла с разными расширениями
# crate-type = ["cdylib", "staticlib"]

Попробуем использовать статическую библиотеку, но теперь пример для C:

// main.c
#include <stdint.h>
#include <stdio.h>

uint32_t doublefast(uint32_t);

int main() {
    printf("Double six: %d\n", doublefast(6));
}

Соберем C код с использованием нашей библиотеки:

clang main.c target/debug/libmylib.a -o ./a.exe

При запуске ./a.exe будет получен ожидаемый результат. Для crate-type возможны следующие значения:

  • staticlib - сборка статической библиотеки
  • dylib - сборка динамической библиотеки, предназначенной для использования в rust коде. Собираться использующий код и dylib должны одной и той же версией компилятора, так как у dylib нет стабильного интерфейса
  • cdylib - сборка динамической библиотеки, но предназначеную для использования во всех языках, поэтому отличается от dylib:
    • интерфейсы фукнций следуют c abi
    • в библиотеку будет включена стандартная rust библиотека (rust-std)
  • bin - сборка конечной программ
  • lib - соберет библиотеку, вид которой будет выбран компилятором (стандартное значение для крейтов-библиотек)
  • rlib - внутренний тип библиотек rust
  • proc-macro - крейт, в котором экспортированы proc макросы

Квиз - одиночный выбор Какое значение нужно указать в crate-type, чтобы использовать ваш rust код как динамическую библитеку в проекте на Go? lib Нет, lib соберет библиотеку на выбор компилятора

cdylib Правильно, cdylib соберет динамическую библиотеку с C ABI, который подходит для Go

dylib Нет, хоть dylib и соберет динамическую библиотеку, но полноценно подходить она будет только для rust кода

staticlib Нет, staticlib соберет статическую библиотеку

// update

cbindgen

Так же, как и для генерации rust байндингов из C есть библитека bindgen, для генерации C/C++/cython байндингов из rust кода есть cbindgen:

cargo install cbindgen

Итоги

В этом уроке мы на практике разобрали, как взаимодействовать с кодом на C в проектах на rust, best practice этого взаимодействия, а так же узнали, как можно взаимодействовать с кодом на rust из других языков. Вы научились автоматически генерировать декларации внешних функций, а так же собирать статические библиотеки при сборке проекта на rust. Далее вы узнаете, что означает ключевое слово unsafe, зачем оно нужно при взаимодействии с внешними библиотеками, а так же изучите best practice при написании unsafe кода.