GNU/Linux >> Znalost Linux >  >> Linux

Proč jsou data zapisována do souboru otevřena s příznakem O_APPEND, který je vždy zapsán na konci, dokonce i s `lseek`?

Když otevřete soubor s O_APPEND , všechna data se zapíší až do konce, bez ohledu na to, jaký je aktuální ukazatel souboru od posledního volání do lseek(2) nebo poslední operace čtení/zápisu. Z open(2) dokumentace:

O_APPEND
Soubor se otevře v režimu připojení. Před každým write(2) , offset souboru je umístěn na konec souboru, jako by měl lseek(2) .

Pokud chcete zapsat data na konec souboru a později na jeho začátek, otevřete jej bez O_APPEND , použijte fstat(2) získat velikost souboru (st_size člen v rámci struct stat ) a poté se pokuste o tento posun, abyste zapsali konec.


Ve skutečnosti O_APPEND ovlivňuje pouze chování write , ale ne u read . Bez ohledu na to, jak se aktuální pozice souboru změní o lseek , write bude vždy append-only .

Když open soubor s O_RDWR | O_APPEND , read bude stále začínat od začátku souboru.

V příručce open (man 2 open ),

O_APPENDSoubor se otevře v režimu připojení. Před každým zápisem (2), posun souboru je umístěn na konec souboru.

V příručce write (man 2 write ),

Je-li nastaven příznak O_APPEND příznaků stavu souboru, musí být offset souboru nastaven na konec souboru před každým zápisem .

V linuxovém jádře fs/ext4 syscall write -> vfs_write -> ext4_file_write_iter ,ext4_file_write_iter zavolá ext4_write_checks

pak zavolejte generic_write_checks

najdete místo, kde se nastavuje pos =file.size

/* FIXME: this is for backwards compatibility with 2.4 */
if (iocb->ki_flags & IOCB_APPEND)
    iocb->ki_pos = i_size_read(inode);
pos = iocb->ki_pos;

Následující ukázka to může ověřit.

cat open_append.cc
#include <fcntl.h>
#include <sys/stat.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>

#include <string>
#include <iostream>

int main(int argc, char *argv[]) {
  std::string path = "./test.txt";
  std::string content = "hello_world";
  std::string read_buf(content.size(), 0x0);
  struct stat st_buf;
  ssize_t bytes_read = -1;
  ssize_t bytes_write = -1;
  int ret = -1;
  off_t cur_off = -1;
  int fd = ::open(path.c_str(), O_CREAT | O_RDWR | O_TRUNC, 0644);
  if (fd < 0) {
    std::cerr << "open err path " << path
              << " errno " << errno << std::endl;
    return -1;
  }
  std::cout << "open ok path " << path
            << " fd " << fd << std::endl;

  // Step 1 write some data into an empty file
  bytes_write = ::write(fd, content.data(), content.size());
  if (bytes_write < 0) {
    std::cerr << "write err fd " << fd
              << " errno " << errno << std::endl;
    goto out;
  }
  std::cout << "write ok fd " << fd
            << " data " << content
            << " nbytes " << bytes_write << std::endl;
  ::close(fd);

  // Step 2 open the file again with O_APPEND
  fd = -1;
  fd = ::open(path.c_str(), O_CREAT | O_RDWR | O_APPEND, 0644);
  if (fd < 0) {
    std::cerr << "open again err path " << path
              << " errno " << errno << std::endl;
    return -1;
  }
  std::cout << "open again ok path " << path
            << " fd " << fd << std::endl;

  // Step 3 the current position of the file NOT affected by O_APPEND
  cur_off = ::lseek(fd, 0, SEEK_CUR);
  if (cur_off < 0) {
    std::cerr << "lseek err SEEK_CUR fd " << fd
              << " errno " << errno << std::endl;
    goto out;
  }
  // cur_off expected to be 0
  std::cout << "lseek ok SEEK_CUR fd " << fd
            << " cur_off " << cur_off << std::endl;

  // Step 4  the read will start from the beginning of the file
  bytes_read = read(fd, (char*)read_buf.data(), content.size());
  if (bytes_read < 0) {
    std::cerr << "read err fd " << fd
              << " errno " << errno << std::endl;
    goto out;
  }
  std::cout << "read ok fd " << fd
            << " data " << read_buf
            << " nbytes " << bytes_read << std::endl;

  // Step 5 change the position to the half of the file size
  cur_off = ::lseek(fd, content.size() / 2, SEEK_SET);
  if (cur_off < 0) {
    std::cerr << "lseek err SEEK_SET fd " << fd
              << " errno " << errno << std::endl;
    goto out;
  }
  // cur_off expected to be content.size() / 2
  std::cout << "lseek ok SEEK_SET fd " << fd
            << " cur_off " << cur_off << std::endl;

  // Step 6 write will append data from the end of the file
  // the current position is ignored
  bytes_write = ::write(fd, content.data(), content.size());
  if (bytes_write < 0) {
    std::cerr << "append write err fd " << fd
              << " errno " << errno << std::endl;
    goto out;
  }
  std::cout << "append write ok fd " << fd
            << " append data " << content
            << " append nbytes " << bytes_write << std::endl;

  // Step 7 the file size is double content.size()
  memset((void*)&st_buf, 0x0, sizeof(struct stat));
  ret = lstat(path.c_str(), &st_buf);
  if (ret < 0) {
    std::cerr << "lstat err path " << path
              << " errno " << errno << std::endl;
    goto out;
  }
  std::cout << "lstat ok path " << path
            << " st_size " << st_buf.st_size << std::endl;
  ret = 0;

out:
  if (fd >= 0) {
    close(fd);
  }
  return ret;
}

Výsledek výstupu

open ok path ./test.txt fd 3
write ok fd 3 data hello_world nbytes 11
open again ok path ./test.txt fd 3
lseek ok SEEK_CUR fd 3 cur_off 0
read ok fd 3 data hello_world nbytes 11
lseek ok SEEK_SET fd 3 cur_off 5
append write ok fd 3 append data hello_world append nbytes 11
lstat ok path ./test.txt st_size 22

Linux
  1. Začínáme s příkazem tac systému Linux

  2. Proč skript Bash nerozpozná aliasy?

  3. Přejít na začátek nebo konec souboru ve Vimu [Rychlý tip]

  1. Proč se vypnutí net rpc nezdaří se správnými přihlašovacími údaji?

  2. Proč je příšerné 'rm -rf /' vůbec povoleno?

  3. Chci změnit DPI pomocí ImageMagick bez změny skutečné velikosti bajtů obrazových dat

  1. Proč je kořenový adresář označen znakem /?

  2. Spustitelný soubor Linuxu selže a soubor nebyl nalezen, i když soubor existuje a je v PATH

  3. Co znamená + na konci oprávnění z ls -l?