Sync RELENG_6_0 with all of the FFS fixes from Tor. - src

diff options


context:
space:
mode:

author	Scott Long <scottl@FreeBSD.org>	2005-10-29 07:00:45 +0000
committer	Scott Long <scottl@FreeBSD.org>	2005-10-29 07:00:45 +0000
commit	087ac34ec21df583385056f8dde1e57614a54afe (patch)
tree	1108632f015693cf0e4fbc3baabc54d1bb3cb697
parent	ede84755f38f9e744460319ea24acb454dcb061e (diff)

Notes

Diffstat

-rw-r--r--

sys/kern/vfs_bio.c

-rw-r--r--

sys/ufs/ffs/ffs_alloc.c

-rw-r--r--

sys/ufs/ffs/ffs_snapshot.c

108

-rw-r--r--

sys/ufs/ffs/ffs_vfsops.c

-rw-r--r--

sys/ufs/ffs/ffs_vnops.c

5 files changed, 59 insertions, 64 deletions

diff --git a/sys/kern/vfs_bio.c b/sys/kern/vfs_bio.c
index afab45513bfc..476f4ec5b586 100644
--- a/sys/kern/vfs_bio.c
+++ b/sys/kern/vfs_bio.c

@@ -2396,8 +2396,7 @@ loop:

bp->b_flags |= B_NOCACHE;

bwrite(bp);

} else {

- if ((bp->b_flags & B_VMIO) &&

- (LIST_FIRST(&bp->b_dep) == NULL)) {

+ if (LIST_FIRST(&bp->b_dep) == NULL) {

bp->b_flags |= B_RELBUF;

brelse(bp);

} else {

diff --git a/sys/ufs/ffs/ffs_alloc.c b/sys/ufs/ffs/ffs_alloc.c
index 88f428e9b908..dc0f263b35d3 100644
--- a/sys/ufs/ffs/ffs_alloc.c
+++ b/sys/ufs/ffs/ffs_alloc.c

@@ -951,6 +951,12 @@ ffs_valloc(pvp, mode, cred, vpp)

ip->i_din2->di_birthnsec = ts.tv_nsec;

}

ip->i_flag = 0;

+ vnode_destroy_vobject(*vpp);

+ (*vpp)->v_type = VNON;

+ if (fs->fs_magic == FS_UFS2_MAGIC)

+ (*vpp)->v_op = &ffs_vnodeops2;

+ else

+ (*vpp)->v_op = &ffs_vnodeops1;

return (0);

noinodes:

UFS_UNLOCK(ump);

diff --git a/sys/ufs/ffs/ffs_snapshot.c b/sys/ufs/ffs/ffs_snapshot.c
index 0aa7df817143..98a1f232ed5a 100644
--- a/sys/ufs/ffs/ffs_snapshot.c
+++ b/sys/ufs/ffs/ffs_snapshot.c

@@ -681,6 +681,17 @@ out1:

VI_UNLOCK(devvp);

if (space != NULL)

FREE(space, M_UFSMNT);

+ /*

+ * If another process is currently writing the buffer containing

+ * the inode for this snapshot then a deadlock can occur. Drop

+ * the snapshot lock until the buffer has been written.

+ */

+ VOP_UNLOCK(vp, 0, td);

+ (void) bread(ip->i_devvp,

+ fsbtodb(fs, ino_to_fsba(fs, ip->i_number)),

+ (int) fs->fs_bsize, NOCRED, &nbp);

+ brelse(nbp);

+ vn_lock(vp, LK_EXCLUSIVE | LK_RETRY, td);

done:

FREE(copy_fs->fs_csp, M_UFSMNT);

bawrite(sbp);

@@ -752,6 +763,8 @@ cgaccount(cg, vp, nbp, passno)

if (fs->fs_cgsize < fs->fs_bsize)

bzero(&nbp->b_data[fs->fs_cgsize],

fs->fs_bsize - fs->fs_cgsize);

+ cgp = (struct cg *)nbp->b_data;

+ bqrelse(bp);

if (passno == 2)

nbp->b_flags |= B_VALIDSUSPWRT;

numblks = howmany(fs->fs_size, fs->fs_frag);

@@ -773,7 +786,6 @@ cgaccount(cg, vp, nbp, passno)

error = UFS_BALLOC(vp, lblktosize(fs, (off_t)(base + loc)),

fs->fs_bsize, KERNCRED, BA_METAONLY, &ibp);

if (error) {

- brelse(bp);

return (error);

}

indiroff = (base + loc - NDADDR) % NINDIR(fs);

@@ -786,7 +798,6 @@ cgaccount(cg, vp, nbp, passno)

lblktosize(fs, (off_t)(base + loc)),

fs->fs_bsize, KERNCRED, BA_METAONLY, &ibp);

if (error) {

- brelse(bp);

return (error);

}

indiroff = 0;

@@ -812,7 +823,6 @@ cgaccount(cg, vp, nbp, passno)

((ufs2_daddr_t *)(ibp->b_data)) [indiroff] == BLK_NOCOPY)

panic("ffs_snapshot: lost indirect block");

}

- bqrelse(bp);

if (passno == 2)

ibp->b_flags |= B_VALIDSUSPWRT;

bdwrite(ibp);

@@ -1484,6 +1494,8 @@ ffs_snapremove(vp)

for (blkno = 1; blkno < NDADDR; blkno++) {

dblk = DIP(ip, i_db[blkno]);

+ if (dblk == 0)

+ continue;

if (dblk == BLK_NOCOPY || dblk == BLK_SNAP)

DIP_SET(ip, i_db[blkno], 0);

else if ((dblk == blkstofrags(fs, blkno) &&

@@ -1507,6 +1519,8 @@ ffs_snapremove(vp)

for (loc = 0; loc < last; loc++) {

if (ip->i_ump->um_fstype == UFS1) {

dblk = ((ufs1_daddr_t *)(ibp->b_data))[loc];

+ if (dblk == 0)

+ continue;

if (dblk == BLK_NOCOPY || dblk == BLK_SNAP)

((ufs1_daddr_t *)(ibp->b_data))[loc]= 0;

else if ((dblk == blkstofrags(fs, blkno) &&

@@ -1519,6 +1533,8 @@ ffs_snapremove(vp)

continue;

}

dblk = ((ufs2_daddr_t *)(ibp->b_data))[loc];

+ if (dblk == 0)

+ continue;

if (dblk == BLK_NOCOPY || dblk == BLK_SNAP)

((ufs2_daddr_t *)(ibp->b_data))[loc] = 0;

else if ((dblk == blkstofrags(fs, blkno) &&

@@ -1570,7 +1586,7 @@ ffs_snapblkfree(fs, devvp, bno, size, inum)

struct vnode *vp = NULL;

ufs_lbn_t lbn;

ufs2_daddr_t blkno;

- int indiroff = 0, snapshot_locked = 0, error = 0, claimedblk = 0;

+ int indiroff = 0, error = 0, claimedblk = 0;

struct snapdata *sn;

lbn = fragstoblks(fs, bno);

@@ -1581,6 +1597,10 @@ retry:

VI_UNLOCK(devvp);

return (0);

}

+ if (lockmgr(&sn->sn_lock,

+ LK_INTERLOCK | LK_EXCLUSIVE | LK_SLEEPFAIL,

+ VI_MTX(devvp), td) != 0)

+ goto retry;

TAILQ_FOREACH(ip, &sn->sn_head, i_nextsnap) {

vp = ITOV(ip);

@@ -1589,12 +1609,6 @@ retry:

if (lbn < NDADDR) {

blkno = DIP(ip, i_db[lbn]);

} else {

- if (snapshot_locked == 0 &&

- lockmgr(vp->v_vnlock,

- LK_INTERLOCK | LK_EXCLUSIVE | LK_SLEEPFAIL,

- VI_MTX(devvp), td) != 0)

- goto retry;

- snapshot_locked = 1;

td->td_pflags |= TDP_COWINPROGRESS;

error = UFS_BALLOC(vp, lblktosize(fs, (off_t)lbn),

fs->fs_bsize, KERNCRED, BA_METAONLY, &ibp);

@@ -1624,16 +1638,6 @@ retry:

if (claimedblk)

panic("snapblkfree: inconsistent block type");

- if (snapshot_locked == 0 &&

- lockmgr(vp->v_vnlock,

- LK_INTERLOCK | LK_EXCLUSIVE | LK_NOWAIT,

- VI_MTX(devvp), td) != 0) {

- if (lbn >= NDADDR)

- bqrelse(ibp);

- vn_lock(vp, LK_EXCLUSIVE | LK_SLEEPFAIL, td);

- goto retry;

- }

- snapshot_locked = 1;

if (lbn < NDADDR) {

DIP_SET(ip, i_db[lbn], BLK_NOCOPY);

ip->i_flag |= IN_CHANGE | IN_UPDATE;

@@ -1664,16 +1668,6 @@ retry:

* routine as to why only a single snapshot needs to

* claim this block.

- if (snapshot_locked == 0 &&

- lockmgr(vp->v_vnlock,

- LK_INTERLOCK | LK_EXCLUSIVE | LK_NOWAIT,

- VI_MTX(devvp), td) != 0) {

- if (lbn >= NDADDR)

- bqrelse(ibp);

- vn_lock(vp, LK_EXCLUSIVE | LK_SLEEPFAIL, td);

- goto retry;

- }

- snapshot_locked = 1;

if (size == fs->fs_bsize) {

#ifdef DEBUG

if (snapdebug)

@@ -1758,10 +1752,7 @@ retry:

* not be freed. Although space will be lost, the snapshot

* will stay consistent.

- if (snapshot_locked)

- lockmgr(vp->v_vnlock, LK_RELEASE, NULL, td);

- else

- VI_UNLOCK(devvp);

+ lockmgr(vp->v_vnlock, LK_RELEASE, NULL, td);

return (error);

}

@@ -1968,9 +1959,11 @@ ffs_copyonwrite(devvp, bp)

struct inode *ip;

struct vnode *vp = 0;

ufs2_daddr_t lbn, blkno, *snapblklist;

- int lower, upper, mid, indiroff, snapshot_locked = 0, error = 0;

+ int lower, upper, mid, indiroff, error = 0;

int launched_async_io, prev_norunningbuf;

+ if ((VTOI(bp->b_vp)->i_flags & SF_SNAPSHOT) != 0)

+ return (0); /* Update on a snapshot file */

if (td->td_pflags & TDP_COWINPROGRESS)

panic("ffs_copyonwrite: recursive call");

@@ -1979,6 +1972,11 @@ ffs_copyonwrite(devvp, bp)

VI_LOCK(devvp);

sn = devvp->v_rdev->si_snapdata;

+ if (sn == NULL ||

+ TAILQ_FIRST(&sn->sn_head) == NULL) {

+ VI_UNLOCK(devvp);

+ return (0); /* No snapshot */

+ }

ip = TAILQ_FIRST(&sn->sn_head);

fs = ip->i_fs;

lbn = fragstoblks(fs, dbtofsb(fs, bp->b_blkno));

@@ -2009,7 +2007,20 @@ ffs_copyonwrite(devvp, bp)

* Not in the precomputed list, so check the snapshots.

-retry:

+ while (lockmgr(&sn->sn_lock,

+ LK_INTERLOCK | LK_EXCLUSIVE | LK_SLEEPFAIL,

+ VI_MTX(devvp), td) != 0) {

+ VI_LOCK(devvp);

+ sn = devvp->v_rdev->si_snapdata;

+ if (sn == NULL ||

+ TAILQ_FIRST(&sn->sn_head) == NULL) {

+ VI_UNLOCK(devvp);

+ if (bp->b_runningbufspace)

+ atomic_add_int(&runningbufspace,

+ bp->b_runningbufspace);

+ return (0); /* Snapshot gone */

+ }

TAILQ_FOREACH(ip, &sn->sn_head, i_nextsnap) {

vp = ITOV(ip);

@@ -2029,14 +2040,6 @@ retry:

if (lbn < NDADDR) {

blkno = DIP(ip, i_db[lbn]);

} else {

- if (snapshot_locked == 0 &&

- lockmgr(vp->v_vnlock,

- LK_INTERLOCK | LK_EXCLUSIVE | LK_SLEEPFAIL,

- VI_MTX(devvp), td) != 0) {

- VI_LOCK(devvp);

- goto retry;

- }

- snapshot_locked = 1;

td->td_pflags |= TDP_COWINPROGRESS | TDP_NORUNNINGBUF;

error = UFS_BALLOC(vp, lblktosize(fs, (off_t)lbn),

fs->fs_bsize, KERNCRED, BA_METAONLY, &ibp);

@@ -2066,14 +2069,6 @@ retry:

* lock, we ensure that we will never be in competition

* with another process to allocate a block.

- if (snapshot_locked == 0 &&

- lockmgr(vp->v_vnlock,

- LK_INTERLOCK | LK_EXCLUSIVE | LK_SLEEPFAIL,

- VI_MTX(devvp), td) != 0) {

- VI_LOCK(devvp);

- goto retry;

- }

- snapshot_locked = 1;

td->td_pflags |= TDP_COWINPROGRESS | TDP_NORUNNINGBUF;

error = UFS_BALLOC(vp, lblktosize(fs, (off_t)lbn),

fs->fs_bsize, KERNCRED, 0, &cbp);

@@ -2135,12 +2130,9 @@ retry:

else

launched_async_io = 1;

}

- if (snapshot_locked) {

- lockmgr(vp->v_vnlock, LK_RELEASE, NULL, td);

- td->td_pflags = (td->td_pflags & ~TDP_NORUNNINGBUF) |

- prev_norunningbuf;

- } else

- VI_UNLOCK(devvp);

+ lockmgr(vp->v_vnlock, LK_RELEASE, NULL, td);

+ td->td_pflags = (td->td_pflags & ~TDP_NORUNNINGBUF) |

+ prev_norunningbuf;

if (launched_async_io && (td->td_pflags & TDP_NORUNNINGBUF) == 0)

waitrunningbufspace();

diff --git a/sys/ufs/ffs/ffs_vfsops.c b/sys/ufs/ffs/ffs_vfsops.c
index 111e7a72ae46..c40d5bbb10ad 100644
--- a/sys/ufs/ffs/ffs_vfsops.c
+++ b/sys/ufs/ffs/ffs_vfsops.c

@@ -1660,9 +1660,7 @@ ffs_bufwrite(struct buf *bp)

}

/* Let the normal bufwrite do the rest for us */

- bufwrite(bp);

- return (0);

+ return (bufwrite(bp));

}

diff --git a/sys/ufs/ffs/ffs_vnops.c b/sys/ufs/ffs/ffs_vnops.c
index c7808f0dc72f..e631db625f34 100644
--- a/sys/ufs/ffs/ffs_vnops.c
+++ b/sys/ufs/ffs/ffs_vnops.c

@@ -454,7 +454,7 @@ ffs_read(ap)

* doing sequential access.

error = cluster_read(vp, ip->i_size, lbn,

- size, NOCRED, uio->uio_resid, seqcount, &bp);

+ size, NOCRED, blkoffset + uio->uio_resid, seqcount, &bp);

} else if (seqcount > 1) {

* If we are NOT allowed to cluster, then