6929cf7a417cf85185842a7c7f3da0f54e2ddfab
[wimlib] / src / inode_fixup.c
1 /*
2  * inode_fixup.c
3  */
4
5 /*
6  * Copyright (C) 2012, 2013, 2014 Eric Biggers
7  *
8  * This file is free software; you can redistribute it and/or modify it under
9  * the terms of the GNU Lesser General Public License as published by the Free
10  * Software Foundation; either version 3 of the License, or (at your option) any
11  * later version.
12  *
13  * This file is distributed in the hope that it will be useful, but WITHOUT
14  * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS
15  * FOR A PARTICULAR PURPOSE. See the GNU Lesser General Public License for more
16  * details.
17  *
18  * You should have received a copy of the GNU Lesser General Public License
19  * along with this file; if not, see http://www.gnu.org/licenses/.
20  */
21
22 #ifdef HAVE_CONFIG_H
23 #  include "config.h"
24 #endif
25
26 #include "wimlib/dentry.h"
27 #include "wimlib/error.h"
28 #include "wimlib/inode.h"
29 #include "wimlib/inode_table.h"
30
31 struct inode_fixup_params {
32         struct wim_inode_table inode_table;
33         unsigned long num_dir_hard_links;
34         unsigned long num_inconsistent_inodes;
35 };
36
37 #define MAX_DIR_HARD_LINK_WARNINGS 8
38
39 static bool
40 inodes_consistent(const struct wim_inode *inode_1,
41                   const struct wim_inode *inode_2)
42 {
43         /* This certainly isn't the only thing we need to check to make sure the
44          * inodes are consistent.  However, this seems to be the only thing that
45          * the MS implementation checks when working around its own bug.
46          *
47          * (Tested: If two dentries share the same hard link group ID, Windows
48          * 8.1 DISM will link them if they have the same unnamed stream hash,
49          * even if the dentries provide different timestamps, attributes,
50          * alternate data streams, and security IDs!  And the one that gets used
51          * will change if you merely swap the filenames.  But if you use
52          * different unnamed stream hashes with everything else the same, it
53          * doesn't link the dentries.)
54          *
55          * For non-buggy WIMs this function will always return true.  */
56         return hashes_equal(inode_get_hash_of_unnamed_data_stream(inode_1),
57                             inode_get_hash_of_unnamed_data_stream(inode_2));
58 }
59
60 static int
61 inode_table_insert(struct wim_dentry *dentry, void *_params)
62 {
63         struct inode_fixup_params *params = _params;
64         struct wim_inode_table *table = &params->inode_table;
65         struct wim_inode *d_inode = dentry->d_inode;
66         size_t pos;
67         struct wim_inode *inode;
68         struct hlist_node *cur;
69
70         if (d_inode->i_ino == 0) {
71                 list_add_tail(&d_inode->i_list, &table->extra_inodes);
72                 return 0;
73         }
74
75         /* Try adding this dentry to an existing inode.  */
76         pos = d_inode->i_ino % table->capacity;
77         hlist_for_each_entry(inode, cur, &table->array[pos], i_hlist) {
78                 if (inode->i_ino != d_inode->i_ino) {
79                         continue;
80                 }
81                 if (unlikely(!inodes_consistent(inode, d_inode))) {
82                         params->num_inconsistent_inodes++;
83                         continue;
84                 }
85                 if (unlikely((d_inode->i_attributes & FILE_ATTRIBUTE_DIRECTORY) ||
86                              (inode->i_attributes & FILE_ATTRIBUTE_DIRECTORY)))
87                 {
88                         params->num_dir_hard_links++;
89                         if (params->num_dir_hard_links <=
90                             MAX_DIR_HARD_LINK_WARNINGS)
91                         {
92                                 WARNING("Unsupported directory hard link "
93                                         "\"%"TS"\" <=> \"%"TS"\"",
94                                         dentry_full_path(dentry),
95                                         inode_first_full_path(inode));
96                         } else if (params->num_dir_hard_links ==
97                                    MAX_DIR_HARD_LINK_WARNINGS + 1)
98                         {
99                                 WARNING("Suppressing additional warnings about "
100                                         "directory hard links...");
101                         }
102                         continue;
103                 }
104                 /* Transfer this dentry to the existing inode.  */
105                 d_disassociate(dentry);
106                 d_associate(dentry, inode);
107                 return 0;
108         }
109
110         /* Keep this dentry's inode.  */
111         hlist_add_head(&d_inode->i_hlist, &table->array[pos]);
112         return 0;
113 }
114
115 /* Move the inodes from the 'struct wim_inode_table' to the 'inode_list'.  */
116 static void
117 build_inode_list(struct wim_inode_table *inode_table,
118                  struct list_head *inode_list)
119 {
120         list_splice(&inode_table->extra_inodes, inode_list);
121         for (size_t i = 0; i < inode_table->capacity; i++) {
122                 while (!hlist_empty(&inode_table->array[i])) {
123                         struct wim_inode *inode;
124
125                         inode = hlist_entry(inode_table->array[i].first,
126                                             struct wim_inode, i_hlist);
127                         hlist_del(&inode->i_hlist);
128                         list_add(&inode->i_list, inode_list);
129                 }
130         }
131 }
132
133 /* Re-assign inode numbers to the inodes in the list.  */
134 static void
135 reassign_inode_numbers(struct list_head *inode_list)
136 {
137         struct wim_inode *inode;
138         u64 cur_ino = 1;
139
140         list_for_each_entry(inode, inode_list, i_list)
141                 inode->i_ino = cur_ino++;
142 }
143
144 /*
145  * Given a WIM image's tree of dentries such that each dentry initially
146  * has a unique inode associated with it, determine the actual
147  * dentry/inode information.  Following this, a single inode may be named
148  * by more than one dentry (usually called a hard link).
149  *
150  * The 'hard_link_group_id' field of the on-disk WIM dentry, which we
151  * have read into 'i_ino' of each dentry's initial inode, determines
152  * which dentries share the same inode.  Ideally, dentries share the same
153  * inode if and only if they have the same value in this field.  However,
154  * exceptions apply:
155  *
156  * - If 'hard_link_group_id' is 0, the corresponding dentry is the sole
157  *   name for its inode.
158  * - Due to bugs in the Microsoft implementation, dentries with different
159  *   'hard_link_group_id' fields may, in fact, need to be interpreted as
160  *   naming different inodes.  This seems to mostly affect images in
161  *   install.wim for Windows 7.  I try to work around this in the same way
162  *   the Microsoft implementation works around this.
163  *
164  * Returns 0 or WIMLIB_ERR_NOMEM.  On success, the resulting inodes will be
165  * appended to the @inode_list, and they will have consistent numbers in their
166  * i_ino fields.
167  */
168 int
169 dentry_tree_fix_inodes(struct wim_dentry *root, struct list_head *inode_list)
170 {
171         struct inode_fixup_params params;
172         int ret;
173
174         /* We use a hash table to map inode numbers to inodes.  */
175
176         ret = init_inode_table(&params.inode_table, 9001);
177         if (ret)
178                 return ret;
179
180         params.num_dir_hard_links = 0;
181         params.num_inconsistent_inodes = 0;
182
183         for_dentry_in_tree(root, inode_table_insert, &params);
184
185         /* Generate the resulting list of inodes, and if needed reassign
186          * the inode numbers.  */
187         build_inode_list(&params.inode_table, inode_list);
188         destroy_inode_table(&params.inode_table);
189
190         if (unlikely(params.num_inconsistent_inodes))
191                 WARNING("Fixed %lu invalid hard links in WIM image",
192                         params.num_inconsistent_inodes);
193
194         if (unlikely(params.num_dir_hard_links))
195                 WARNING("Ignoring %lu directory hard links",
196                         params.num_dir_hard_links);
197
198         if (unlikely(params.num_inconsistent_inodes ||
199                      params.num_dir_hard_links))
200                 reassign_inode_numbers(inode_list);
201         return 0;
202 }