]> wimlib.net Git - wimlib/blob - src/wimlib_internal.h
71a7a593560a4f15c12a7f32c9ca5906591d08aa
[wimlib] / src / wimlib_internal.h
1 /*
2  * wimlib_internal.h
3  *
4  * Internal header for wimlib.
5  */
6
7 /*
8  * Copyright (C) 2010 Carl Thijssen
9  * Copyright (C) 2012 Eric Biggers
10  *
11  * This file is part of wimlib, a library for working with WIM files.
12  *
13  * wimlib is free software; you can redistribute it and/or modify it under the
14  * terms of the GNU General Public License as published by the Free
15  * Software Foundation; either version 3 of the License, or (at your option)
16  * any later version.
17  *
18  * wimlib is distributed in the hope that it will be useful, but WITHOUT ANY
19  * WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR
20  * A PARTICULAR PURPOSE. See the GNU General Public License for more
21  * details.
22  *
23  * You should have received a copy of the GNU General Public License
24  * along with wimlib; if not, see http://www.gnu.org/licenses/.
25  */
26
27 #ifndef _WIMLIB_INTERNAL_H
28 #define _WIMLIB_INTERNAL_H
29
30 #include "config.h"
31 #include "util.h"
32 #include "list.h"
33
34 #include "wimlib.h"
35
36 #ifdef WITH_FUSE
37 #include <pthread.h>
38 #endif
39
40 struct stat;
41 struct dentry;
42 struct inode;
43
44 #define WIM_MAGIC_LEN  8
45 #define WIM_GID_LEN    16
46 #define WIM_UNUSED_LEN 60
47
48
49 /* Length of the WIM header on disk. */
50 #define WIM_HEADER_DISK_SIZE (148 + WIM_UNUSED_LEN)
51
52 /* Compressed resources in the WIM are divided into separated compressed chunks
53  * of this size. */
54 #define WIM_CHUNK_SIZE 32768
55
56 /* Version of the WIM file.  There is an older version, but we don't support it
57  * yet.  The differences between the versions are undocumented. */
58 #define WIM_VERSION 0x10d00
59
60 #define WIM_INTEGRITY_OK 0
61 #define WIM_INTEGRITY_NOT_OK -1
62 #define WIM_INTEGRITY_NONEXISTENT -2
63
64 /* Metadata for a resource in a WIM file. */
65 struct resource_entry {
66         /* Size, in bytes, of the resource in the WIM file. */
67         u64 size  : 56;
68
69         /* Bitwise or of one or more of the WIM_RESHDR_FLAG_* flags. */
70         u64 flags : 8;
71
72         /* Offset, in bytes, of the resource in the WIM file. */
73         u64 offset;
74
75         /* Uncompressed size of the resource in the WIM file.  Is the same as
76          * @size if the resource is uncompressed. */
77         u64 original_size;
78 };
79
80 /* Flags for the `flags' field of the struct resource_entry structure. */
81
82 /* I haven't seen this flag used in any of the WIMs I have examined.  I assume
83  * it means that there are no references to the stream, so the space is free.
84  * However, even after deleting files from a WIM mounted with `imagex.exe
85  * /mountrw', I could not see this flag being used.  Either way, we don't
86  * actually use this flag for anything. */
87 #define WIM_RESHDR_FLAG_FREE            0x01
88
89 /* Indicates that the stream is a metadata resource for a WIM image. */
90 #define WIM_RESHDR_FLAG_METADATA        0x02
91
92 /* Indicates that the stream is compressed. */
93 #define WIM_RESHDR_FLAG_COMPRESSED      0x04
94
95 /* I haven't seen this flag used in any of the WIMs I have examined.  Perhaps it
96  * means that a stream could possibly be split among multiple split WIM parts.
97  * However, `imagex.exe /split' does not seem to create any WIMs like this.
98  * Either way, we don't actually use this flag for anything.  */
99 #define WIM_RESHDR_FLAG_SPANNED         0x08
100
101
102 /* Header at the very beginning of the WIM file. */
103 struct wim_header {
104         /* Identifies the file as WIM file. Must be exactly
105          * {'M', 'S', 'W', 'I', 'M', 0, 0, 0}  */
106         //u8  magic[WIM_MAGIC_LEN];
107
108         /* size of WIM header in bytes. */
109         //u32 hdr_size;
110
111         /* Version of the WIM file.  Microsoft provides no documentation about
112          * exactly what this field affects about the file format, other than the
113          * fact that more recent versions have a higher value. */
114         //u32 version;
115
116         /* Bitwise OR of one or more of the WIM_HDR_FLAG_* defined below. */
117         u32 flags;
118
119         /* The size of the pieces that the uncompressed files were split up into
120          * when they were compressed.  This should be the same as
121          * WIM_CHUNK_SIZE.  Microsoft incorrectly documents this as "the size of
122          * the compressed .wim file in bytes".*/
123         //u32 chunk_size;
124
125         /* A unique identifier for the WIM file. */
126         u8  guid[WIM_GID_LEN];
127
128         /* Part number of the WIM file in a spanned set. */
129         u16 part_number;
130
131         /* Total number of parts in a spanned set. */
132         u16 total_parts;
133
134         /* Number of images in the WIM file. */
135         u32 image_count;
136
137         /* Location, size, and flags of the lookup table of the WIM. */
138         struct resource_entry lookup_table_res_entry;
139
140         /* Location, size, and flags for the XML data of the WIM. */
141         struct resource_entry xml_res_entry;
142
143         /* Location, size, and flags for the boot metadata.  This means the
144          * metadata resource for the image specified by boot_idx below.  Should
145          * be zeroed out if boot_idx is 0. */
146         struct resource_entry boot_metadata_res_entry;
147
148         /* The index of the bootable image in the WIM file. If 0, there are no
149          * bootable images available. */
150         u32 boot_idx;
151
152         /* The location of the optional integrity table used to verify the
153          * integrity WIM.  Zeroed out if there is no integrity table.*/
154         struct resource_entry integrity;
155
156         /* Reserved for future disuse */
157         //u8 unused[WIM_UNUSED_LEN];
158 };
159
160 /* Flags for the `flags' field of the struct wim_header: */
161
162 /* Reserved for future use */
163 #define WIM_HDR_FLAG_RESERVED           0x00000001
164
165 /* Files and metadata in the WIM are compressed. */
166 #define WIM_HDR_FLAG_COMPRESSION        0x00000002
167
168 /* WIM is read-only (wimlib ignores this because it's pretty much pointless) */
169 #define WIM_HDR_FLAG_READONLY           0x00000004
170
171 /* Resource data specified by images in this WIM may be contained in a different
172  * WIM.  Or in other words, this WIM is part of a split WIM.  */
173 #define WIM_HDR_FLAG_SPANNED            0x00000008
174
175 /* The WIM contains resources only; no filesystem metadata.  wimlib ignores this
176  * flag, as it looks for resources in all the WIMs anyway. */
177 #define WIM_HDR_FLAG_RESOURCE_ONLY      0x00000010
178
179 /* The WIM contains metadata only.  wimlib ignores this flag.  Note that all the
180  * metadata resources for a split WIM should be in the first part. */
181 #define WIM_HDR_FLAG_METADATA_ONLY      0x00000020
182
183 /* Lock field to prevent multiple writers from writing the WIM concurrently.
184  * wimlib ignores this flag as it uses flock() to acquire a real lock on the
185  * file (if supported by the underlying filesystem). */
186 #define WIM_HDR_FLAG_WRITE_IN_PROGRESS  0x00000040
187
188 /* Reparse point fixup ???
189  * This has something to do with absolute targets of reparse points / symbolic
190  * links but I don't know what.  wimlib ignores this flag.  */
191 #define WIM_HDR_FLAG_RP_FIX             0x00000080
192
193 /* Unused, reserved flag for another compression type */
194 #define WIM_HDR_FLAG_COMPRESS_RESERVED  0x00010000
195
196 /* Resources within the WIM are compressed using "XPRESS" compression, which is
197  * a LZ77-based compression algorithm. */
198 #define WIM_HDR_FLAG_COMPRESS_XPRESS    0x00020000
199
200 /* Resources within the WIM are compressed using "LZX" compression.  This is also
201  * a LZ77-based algorithm. */
202 #define WIM_HDR_FLAG_COMPRESS_LZX       0x00040000
203
204 #ifdef WITH_NTFS_3G
205 struct _ntfs_volume;
206 #endif
207
208 /* Structure for security data.  Each image in the WIM file has its own security
209  * data. */
210 struct wim_security_data {
211         /* The total length of the security data, in bytes.  If there are no
212          * security descriptors, this field may be either 8 (which is correct)
213          * or 0 (which is interpreted as 0). */
214         u32 total_length;
215
216         /* The number of security descriptors in the array @descriptors, below.
217          * It is really an unsigned int, but it must fit into an int because the
218          * security ID's are signed.  (Not like you would ever have more than a
219          * few hundred security descriptors anyway.) */
220         int32_t num_entries;
221
222         /* Array of sizes of the descriptors in the array @descriptors. */
223         u64 *sizes;
224
225         /* Array of descriptors. */
226         u8 **descriptors;
227
228         /* Keep track of how many WIMs reference this security data (used when
229          * exporting images between WIMs) */
230         u32 refcnt;
231 };
232
233 struct inode_table;
234
235 /* Metadata resource for an image. */
236 struct image_metadata {
237         /* Pointer to the root dentry for the image. */
238         struct dentry    *root_dentry;
239
240         /* Pointer to the security data for the image. */
241         struct wim_security_data *security_data;
242
243         /* A pointer to the lookup table entry for this image's metadata
244          * resource. */
245         struct lookup_table_entry *metadata_lte;
246
247         /* Linked list of inodes for this image. */
248         struct hlist_head inode_list;
249
250         /* True iff the dentry tree has been modified.  If this is the case, the
251          * memory for the dentry tree is not freed when switching to a different
252          * WIM image. */
253         u8 modified : 1;
254
255         /* True iff this image has been mounted read-write. */
256         u8 has_been_mounted_rw : 1;
257 };
258
259 #define WIMLIB_RESOURCE_FLAG_RAW                0x1
260 #define WIMLIB_RESOURCE_FLAG_MULTITHREADED      0x2
261 #define WIMLIB_RESOURCE_FLAG_RECOMPRESS         0x4
262
263 /* The opaque structure exposed to the wimlib API. */
264 struct WIMStruct {
265
266         /* A pointer to the file indicated by @filename, opened for reading. */
267         FILE *fp;
268
269 #ifdef WITH_FUSE
270         /* Extra file pointers to be used by concurrent readers */
271         FILE **fp_tab;
272         size_t num_allocated_fps;
273         pthread_mutex_t fp_tab_mutex;
274 #endif
275
276         /* FILE pointer for the WIM file (if any) currently being written. */
277         FILE *out_fp;
278
279         /* The name of the WIM file that has been opened. */
280         char *filename;
281
282         /* The lookup table for the WIM file. */
283         struct lookup_table *lookup_table;
284
285         /* Pointer to the XML data read from the WIM file. */
286         u8 *xml_data;
287
288         /* Information retrieved from the XML data, arranged in an orderly
289          * manner. */
290         struct wim_info *wim_info;
291
292         /* Array of the image metadata, one for each image in the WIM. */
293         struct image_metadata *image_metadata;
294
295         /* The header of the WIM file. */
296         struct wim_header hdr;
297
298         /* Temporary fields */
299         union {
300                 bool write_metadata;
301                 void *private;
302         };
303 #ifdef WITH_NTFS_3G
304         struct _ntfs_volume *ntfs_vol;
305 #endif
306
307         /* The currently selected image, indexed starting at 1.  If not 0,
308          * subtract 1 from this to get the index of the current image in the
309          * image_metadata array. */
310         int current_image;
311
312         /* %true iff any images have been deleted from this WIM. */
313         bool deletion_occurred;
314
315         bool all_images_verified;
316         bool full_verification_in_progress;
317 };
318
319
320 /* Inline utility functions for WIMStructs. */
321
322 static inline struct dentry *wim_root_dentry(WIMStruct *w)
323 {
324         return w->image_metadata[w->current_image - 1].root_dentry;
325 }
326
327 static inline struct wim_security_data *
328 wim_security_data(WIMStruct *w)
329 {
330         return w->image_metadata[w->current_image - 1].security_data;
331 }
332 static inline const struct wim_security_data *
333 wim_const_security_data(const WIMStruct *w)
334 {
335         return w->image_metadata[w->current_image - 1].security_data;
336 }
337
338 static inline struct lookup_table_entry*
339 wim_metadata_lookup_table_entry(WIMStruct *w)
340 {
341         return w->image_metadata[w->current_image - 1].metadata_lte;
342 }
343
344 /* Nonzero if a struct resource_entry indicates a compressed resource. */
345 static inline int resource_is_compressed(const struct resource_entry *entry)
346 {
347         return (entry->flags & WIM_RESHDR_FLAG_COMPRESSED);
348 }
349
350 static inline struct image_metadata *
351 wim_get_current_image_metadata(WIMStruct *w)
352 {
353         return &w->image_metadata[w->current_image - 1];
354 }
355
356 struct pattern_list {
357         const char **pats;
358         size_t num_pats;
359         size_t num_allocated_pats;
360 };
361
362 struct capture_config {
363         struct pattern_list exclusion_list;
364         struct pattern_list exclusion_exception;
365         struct pattern_list compression_exclusion_list;
366         struct pattern_list alignment_list;
367         char *config_str;
368         char *prefix;
369         size_t prefix_len;
370 };
371
372 /* add_image.c */
373 extern bool exclude_path(const char *path,
374                          const struct capture_config *config,
375                          bool exclude_prefix);
376 extern int add_new_dentry_tree(WIMStruct *dest_wim, struct dentry *root,
377                                struct wim_security_data *sd);
378
379 /* hardlink.c */
380
381 /* Hash table to find inodes, identified by their inode ID.
382  * */
383 struct inode_table {
384         /* Fields for the hash table */
385         struct hlist_head *array;
386         u64 num_entries;
387         u64 capacity;
388
389         /*
390          * Linked list of "extra" inodes.  These may be:
391          *
392          * - inodes with link count 1, which are all allowed to have 0 for their
393          *   inode number, meaning we cannot insert them into the hash table
394          *   before calling assign_inode_numbers().
395          *
396          * - Groups we create ourselves by splitting a nominal inode due to
397          *   inconsistencies in the dentries.  These inodes will share a inode
398          *   ID with some other inode until assign_inode_numbers() is called.
399          */
400         struct hlist_head extra_inodes;
401 };
402
403 extern int init_inode_table(struct inode_table *table, size_t capacity);
404 static inline void destroy_inode_table(struct inode_table *table)
405 {
406         FREE(table->array);
407 }
408 extern int inode_table_insert(struct dentry *dentry, void *__table);
409 extern u64 assign_inode_numbers(struct hlist_head *inode_list);
410 extern int fix_inodes(struct inode_table *table, struct hlist_head *inode_list);
411
412 /* header.c */
413 extern int read_header(FILE *fp, struct wim_header *hdr, int split_ok);
414 extern int write_header(const struct wim_header *hdr, FILE *out);
415 extern int init_header(struct wim_header *hdr, int ctype);
416
417 /* integrity.c */
418 extern int write_integrity_table(FILE *out,
419                                  struct resource_entry *integrity_res_entry,
420                                  off_t new_lookup_table_end,
421                                  off_t old_lookup_table_end,
422                                  wimlib_progress_func_t progress_func);
423
424 extern int check_wim_integrity(WIMStruct *w,
425                                wimlib_progress_func_t progress_func);
426
427 /* join.c */
428
429 extern int new_joined_lookup_table(WIMStruct *w,
430                                    WIMStruct **additional_swms,
431                                    unsigned num_additional_swms,
432                                    struct lookup_table **table_ret);
433
434 extern int verify_swm_set(WIMStruct *w,
435                           WIMStruct **additional_swms,
436                           unsigned num_additional_swms);
437 extern int wim_run_full_verifications(WIMStruct *w);
438
439 /* ntfs-apply.c */
440
441 struct apply_args {
442         WIMStruct *w;
443         const char *target;
444         int extract_flags;
445         unsigned num_lutimes_warnings;
446         struct list_head *stream_list;
447         union wimlib_progress_info progress;
448 #ifdef WITH_NTFS_3G
449         struct _ntfs_volume *vol;
450 #endif
451         struct list_head empty_files;
452         wimlib_progress_func_t progress_func;
453 };
454
455 extern int apply_dentry_ntfs(struct dentry *dentry, void *arg);
456 extern int apply_dentry_timestamps_ntfs(struct dentry *dentry, void *arg);
457
458 /* ntfs-capture.c */
459 extern int build_dentry_tree_ntfs(struct dentry **root_p,
460                                   const char *device,
461                                   struct lookup_table *lookup_table,
462                                   struct wim_security_data *sd,
463                                   const struct capture_config *config,
464                                   int add_image_flags,
465                                   wimlib_progress_func_t progress_func,
466                                   void *extra_arg);
467
468 /* resource.c */
469 extern const u8 *get_resource_entry(const u8 *p, struct resource_entry *entry);
470 extern u8 *put_resource_entry(u8 *p, const struct resource_entry *entry);
471
472 extern int read_uncompressed_resource(FILE *fp, u64 offset, u64 size, u8 buf[]);
473
474 extern int read_wim_resource(const struct lookup_table_entry *lte, u8 buf[],
475                              size_t size, u64 offset, int flags);
476
477 extern int read_full_wim_resource(const struct lookup_table_entry *lte,
478                                   u8 buf[], int flags);
479
480 extern int write_wim_resource(struct lookup_table_entry *lte,
481                               FILE *out_fp, int out_ctype,
482                               struct resource_entry *out_res_entry,
483                               int flags);
484
485 extern int extract_wim_resource_to_fd(const struct lookup_table_entry *lte,
486                                       int fd, u64 size);
487
488
489 extern int extract_full_wim_resource_to_fd(const struct lookup_table_entry *lte,
490                                            int fd);
491
492 extern int read_metadata_resource(WIMStruct *w,
493                                   struct image_metadata *image_metadata);
494
495
496 extern int write_dentry_resources(struct dentry *dentry, void *wim_p);
497 extern int copy_resource(struct lookup_table_entry *lte, void *w);
498 extern int write_metadata_resource(WIMStruct *w);
499
500
501 /* security.c */
502 int read_security_data(const u8 metadata_resource[],
503                 u64 metadata_resource_len, struct wim_security_data **sd_p);
504
505 void print_security_data(const struct wim_security_data *sd);
506 u8 *write_security_data(const struct wim_security_data *sd, u8 *p);
507 void free_security_data(struct wim_security_data *sd);
508
509 /* symlink.c */
510 ssize_t inode_readlink(const struct inode *inode, char *buf, size_t buf_len,
511                         const WIMStruct *w, int read_resource_flags);
512 extern void *make_symlink_reparse_data_buf(const char *symlink_target,
513                                            size_t *len_ret);
514 extern int inode_set_symlink(struct inode *inode,
515                              const char *target,
516                              struct lookup_table *lookup_table,
517                              struct lookup_table_entry **lte_ret);
518
519 /* wim.c */
520 extern WIMStruct *new_wim_struct();
521 extern int select_wim_image(WIMStruct *w, int image);
522 extern int wim_hdr_flags_compression_type(int wim_hdr_flags);
523 extern int for_image(WIMStruct *w, int image, int (*visitor)(WIMStruct *));
524 extern void destroy_image_metadata(struct image_metadata *imd,
525                                    struct lookup_table *lt);
526
527 /* Internal use only */
528 #define WIMLIB_WRITE_FLAG_NO_LOOKUP_TABLE       0x80000000
529 #define WIMLIB_WRITE_FLAG_REUSE_INTEGRITY_TABLE 0x40000000
530 #define WIMLIB_WRITE_FLAG_CHECKPOINT_AFTER_XML  0x20000000
531 #define WIMLIB_WRITE_MASK_PUBLIC                0x1fffffff
532
533 /* Internal use only */
534 #define WIMLIB_EXTRACT_FLAG_MULTI_IMAGE         0x80000000
535 #define WIMLIB_EXTRACT_FLAG_NO_STREAMS          0x40000000
536 #define WIMLIB_EXTRACT_MASK_PUBLIC              0x3fffffff
537
538
539 /* write.c */
540 extern int begin_write(WIMStruct *w, const char *path, int write_flags);
541 extern void close_wim_writable(WIMStruct *w);
542
543 extern int finish_write(WIMStruct *w, int image, int write_flags,
544                         wimlib_progress_func_t progress_func);
545
546 #if defined(HAVE_SYS_FILE_H) && defined(HAVE_FLOCK)
547 extern int lock_wim(FILE *fp, const char *path);
548 #else
549 static inline int lock_wim(FILE *fp, const char *path)
550 {
551         return 0;
552 }
553 #endif
554
555 #endif /* _WIMLIB_INTERNAL_H */
556